2. 上海勘测设计研究院有限公司,上海 200050;
3. 中国长江三峡集团有限公司长江生态环境工程研究中心(上海),上海 200050;
4. 景遥(上海)信息技术有限公司,上海 201109;
5. 华东师范大学地理科学学院,上海 201109
2. Shanghai Investigation, Design & Research Institute Co., Ltd., Shanghai 200050, China;
3. Yangtze River Ecological and Environmental Engineering Research Center(Shanghai) of China Three Gorges Corporation, Shanghai 200050, China;
4. Jingyao(Shanghai) Information Technology Co., Ltd., Shanghai 201109, China;
5. School of Geographical Sciences, East China Normal University, Shanghai 201109, China
淀山湖地处上海西郊,黄浦江上游,作为天然淡水湖泊,是上海市最重要的饮用水水源保护区之一。随着经济与社会的发展,人类生产生活对淀山湖的影响日渐增大,其中以氮、磷为主的水体富营养化是较为常见的问题之一。水体出现富营养化主要表现为浮游生物的大量繁殖,导致水质恶化、破坏湖泊生态平衡[1-3]。因此对淀山湖水质中氮、磷浓度的全方位动态监测尤其重要。
传统的水质监测多采取人工现场采样、实验室分析等方式,虽然这些方式单点精度高,但效率低,且在表征整体水质方面有较大限制[4]。近年来,国家对环境监测工作提出了“加快建立现代化生态环境监测体系,健全‘天空地海’一体化监测网络的要求”。随着对地观测卫星传感器的空间及光谱分辨率的提高,卫星遥感技术被广泛应用于水质监测[5-8]。早在20世纪80年代,Carpenter等[9]就基于实测水质参数与陆地卫星多光谱扫描(Landsat MSS) 遥感影像光谱间的相互关系,创建了澳大利亚3个湖泊的水质参数反演模型。Yang等[10]分析了多种波段光谱比值与水体叶绿素a浓度相关关系,指出以R716/R667(716 nm波长处的光谱值/667 nm波长处的光谱值)和实测叶绿素a浓度构建的反演模型效果最好。王云霞等[11]以陆地卫星8(Landsat 8)B4波段与B5波段的比值为自变量,构建了最小二乘支持向量机(LS-SVM) 遥感反演模型,实现了平均相对误差为6.06%的清河水库总磷浓度反演。鲁婉婷等[12]基于北京二号卫星影像的B1—B4波段构建了一元及多元回归模型,对台州椒江入海口水域的氨氮、总磷和高锰酸盐指数(IMn)进行了遥感反演,并指出4个波段组合的多元回归模型在各水质参数的反演中,决定系数均最高。黎栩霞等[13]利用中分辨率成像光谱仪(MODIS) 卫星数据,通过水质遥感反演和赤潮自动化提取模型,首次揭示了深圳海域水质关键参数与赤潮暴发的时空格局,并分析了主要驱动因素。
前人基于遥感技术对水质参数的研究,多聚焦于模型构建,很少进一步分析水质参数空间分布格局与潜在影响因子间的关系[14-17]。部分对水质空间分布格局的溯源及驱动因素分析,也多基于取样实测数据[18-20],但取样数据对水域整体格局描绘能力差。《长三角生态绿色一体化发展示范区国土空间总体规划(2019—2035)年》提出,至2025年,淀山湖水质达到Ⅳ类(总氮Ⅴ类)标准。为了保护和改善淀山湖的水环境,弥补传统水质监测的不足,本研究基于卫星、无人机遥感及地面走航实测数据,通过淀山湖天空地一体立体水质监测网络,对水质空间分布格局进行溯源分析,旨在全面了解淀山湖的水质状况,为制定科学合理的水环境治理方案提供支持。基于湖泊水质评价常见指标及走航船监测项目,本研究筛选了总磷(TP)、氨氮(NH3-N)及叶绿素a(Chl.a)3个指标作为应用尝试指标。
1 研究区概况淀山湖位于上海市青浦区与江苏省昆山市交界处,是上海最大的淡水湖泊,总面积62~63 km2,周边水系发达,上游承接太湖吴江地区来水,经急水港、大朱库、白石矾等24条河港汊入湖,河道总长约50.46 km;经拦路港东西泖河、斜塘,下泄入黄浦江[2, 19, 21-23]。据统计,淀山湖环湖六镇约有水田59.75 km2,湖区主航道为苏申外港线南航道,日均船舶流量约500艘次,浮游植物约8门80属210种(含变型、变种)[19, 22-24]。
2 数据与方法 2.1 数据来源 2.1.1 卫星数据常见的免费开源卫星遥感数据包括陆地卫星(Landsat)系列及哨兵-2号卫星(Sentinel-2)等[24]。相较于Landsat系列卫星数据,Sentinel-2具有高时间(重访周期5 d)、空间(10 m)及光谱(13个波段)分辨率的优点,在水体特征分析中更具优势。Sentinel-2的L2A产品已经大气校正,选用该产品对研究区水质参数进行反演。经筛选,选择2023年11月29日的Sentinel-2-L2A影像为本研究区最新且云量符合要求的卫星数据进行水质反演。
2.1.2 无人机可见光数据2023年12月7日,采用飞马机器人公司生产的V10复合翼无人机,搭载飞马Cam10可见光传感器(相机型号:SONY A7R4,分辨率9 504×6 336,有效像素6 100万,像元尺寸3.76 μm,焦距40 mm),飞行高度500 m,飞行速度20 m/s,航带内重叠度80%,航带间重叠度60%,地面分辨率5 cm,共采集影像4 086张。
2.1.3 走航水质数据2023年12月7日,通过青环保1号[搭载谱育科技水质多参数监测仪(WCS-4000)、营养盐水质分析仪(SUPEC 5100)及水环境巡航监测系统(MOST 8000)],进行水质监测。监测指标为水温、pH值、溶解氧、电导率、浊度、氨氮、化学需氧量(CODCr)及总磷。研究区位置及走航水质采样点分布示意见图 1。
随机森林算法是一种集成模型,在非线性特征模拟等方面有很好的表现,以往的研究表明,其构建的水质参数遥感模型更具泛化性[25]。参考相关总磷及氨氮的水质参数反演研究[26-28],通过对Sentinel-2-L2A影像数据B1—B12的不同波段进行四则运算及归一化组合,将走航测得的水质参数实测值与构建的波段组合光谱值之间进行皮尔逊(Pearson)相关性分析,基于分析结果选定对水质参数较为敏感的前5种波段组合(表 1)。在R语言软件中,基于走航实测水质参数浓度值及对应采样点位5种波段组合光谱值,构建样本数据,并将样本数据按照8 ∶ 2的比例随机划分为训练集与测试集,构建基于随机森林算法的水质反演模型。本研究中叶绿素a浓度因仅有淀山湖水域的4个浮标实测数据,样本量不足,故参考沈蔚等[29]叶绿素a浓度波段比值反演模型,以Sentinel-2-L2A影像的对应波段作为输入数据,对淀山湖的水质参数进行反演。
通过均方根误差(RMSE)和决定系数(R2)对水质反演模型的精度进行验证。RMSE及R2计算公式见式(1)和式(2)。
$ \text { RMSE }=\sqrt{\frac{1}{n} \sum\limits_{i=1}^n\left(y_i-\hat{y}_i\right)^2} $ | (1) |
$ R^2=1-\frac{\sum_{i=1}^n\left(y_i-\hat{y}_i\right)^2}{\sum_{i=1}^n\left(y_i-\bar{y}_i\right)^2} $ | (2) |
式中:n——样本数量;yi——第i个样本的真实水质浓度值,mg/L;
主要入湖支流、船只、水生植物及岸边主要农田均会对淀山湖水质产生影响。水生植物及船只的识别基于深度学习神经网络构建目标检测算法,在无人机可见光相机获取的高分辨率(5 cm)正射影像上进行识别。主要支流入湖口及农田通过对研究区正射影像进行专家目视解译获得。由于实验时间在冬季,影像中淀山湖的水草在湖边有零星分布。经统计,淀山湖及相连水域的枯死水生植物面积约0.14 km2;淀山湖区域共发现约178艘动力船,船只主要分布在江苏急水港和上海拦路港航线上,且有些船满载货物;农业是河流和水系重要的面源污染源,农田面积约2.87 km2。淀山湖区域周边各影响因素分布见图 2。
基于主要支流入湖口、船只、水生植物及农田的矢量,在地理信息系统(ArcGIS)中进行欧氏距离分析。研究区水域距支流入湖口、船只、水生植物及农田距离及采样格网见图 3(a)—(e)。为进一步探究淀山湖区域船只航行及水生植物对各水质参数的影响,在研究区内创建了5 672个100 m分辨率的采样格网,用以提取每个格网距影响因素的平均距离与格网内各水质参数均值,于R语言软件中进行相关性分析。同时为了进一步量化距影响因素距离对各水质参数空间分布格局的影响,基于R软件中的glmulti包,构建各水质参数与距各影响因素距离的广义线性回归模型,模型的优劣通过赤池信息量准则(AIC)值来评价,常用以权衡模型的复杂度和此模型对数据拟合的优良性,AIC值越低,则模型的拟合效果越好[30]。AIC值计算公式见式(3)。
$ \mathrm{AIC}=(2 k-2 L) / n $ | (3) |
式中:k——拟合模型中的参数数量;L——对数似然值;n——观测值数量。
用T值(T-statistic)和P值(P-value)解释在最优模型回归分析中每个变量的统计显著性。其中T值表示自变量的系数与其标准误差的比值,绝对值越大,表示该变量的影响力越大;P值表示该系数为0的假设(即该变量无显著影响)的概率,P值越小,表明越可以拒绝“系数为0”的假设,即该变量具有显著性。回归系数是回归方程中自变量对因变量影响大小的参数,可衡量变量间关系强度,确定相关方向,用于预测与控制以及比较自变量的相对重要性。
3 研究结果 3.1 水质反演模型精度验证总磷和氨氮反演模型精度见图 4(a)(b)。由图 4可见,本研究构建的总磷质量浓度反演模型结果相对偏低,反演结果为0.02 ~0.10 mg/L,RMSE为0.019 1 mg/L,R2为0.64(P < 0.001),反演精度基本满足要求。氨氮质量浓度反演模型结果相对偏高,反演结果为0.33~0.58 mg/L,RMSE为0.036 0 mg/L,R2为0.83(P < 0.001),精度满足淀山湖区域氨氮浓度反演需求。
对淀山湖水体总磷浓度进行准确监测,是对淀山湖水环境进行有效管理和控制水体富营养化的重要环节。各水质参数反演结果空间分布见图 5(a)—(c)。
由图 5可见,淀山湖总磷质量浓度高值区域主要集中于西部及北部的主要支流入湖口区域,表明这些主要入湖支流是淀山湖总磷的主要来源,与卢嘉等[3]的研究结果相似;除此之外,本研究发现总磷浓度高值区域与船只分布也有较高的一致性,船只活动可能是湖水总磷的另一个重要来源。淀山湖氨氮质量浓度高值区域出现在西部和北部水域,中部水域氨氮浓度较低。叶绿素a浓度在主要入湖支流口附近相对较低,空间分布上呈现出北高南低、东高西低及岸边高、中心低的趋势,与水生植物空间分布具有较高的一致性。
3.3 淀山湖水质分布溯源分析各水质参数与距各影响因素距离相关性分析结果见表 2。由表 2可见,支流入湖口、船只、水生植物及农田对各水质参数均有显著影响,其中支流入湖口与各水质参数的相关性均最强。距主要支流入湖口距离与总磷及氨氮浓度均呈极显著负相关,与叶绿素a浓度呈极显著正相关,即距支流入湖口越远,总磷及氨氮浓度越低,叶绿素a浓度越高。距船只距离与总磷及氨氮浓度呈极显著负相关,与叶绿素a浓度呈极显著正相关,即距船只越远的水域,总磷及氨氮浓度越低,叶绿素a浓度越高。距水生植物距离与总磷及叶绿素a浓度呈极显著负相关,与氨氮浓度呈极显著正相关。距农田距离与总磷及氨氮浓度呈极显著负相关,即距离农田距离越近,淀山湖总磷和氨氮的浓度越高;与叶绿素a浓度相关性不显著。
各水质参数回归模型AIC值及权重情况见表 3。最优模型回归系数见表 4。由表 3和表 4可见,主要支流入湖口对淀山湖各水质参数的空间分布影响均最大。在总磷浓度分布中,主要支流入湖口影响程度分别为船只、水生植物、农田的1.9,4.8,2.7倍,各影响因素对总磷浓度分布的影响程度(T值)从大到小依次为:支流入湖口>船只>农田>水生植物。在氨氮浓度分布中,主要支流入湖口影响程度分别为船只、水生植物、农田的1.4,2.8,9.4倍,各影响因素对氨氮浓度分布的影响程度从大到小依次为:支流入湖口>船只>水生植物>农田。在叶绿素a浓度分布中,主要支流入湖口影响程度分别为船只、水生植物的3.7和1.2倍,各影响因素对叶绿素a浓度分布的影响程度从大到小依次为:支流入湖口>水生植物>船只>农田。
(1) 通过卫星反演和走航船实测水质的结果对比,反演模型均具有较高的精度。总磷质量浓度反演结果的RMSE为0.019 1 mg/L,R2达到0.64(P < 0.001);氨氮质量浓度反演结果的RMSE为0.036 0 mg/L,R2=0.83(P < 0.001)。表明基于卫星、无人机遥感及走航天空地一体立体水质监测网络的水质反演模型具有较高的可靠性和准确性。
(2) 水质空间分布特征:总磷浓度高值区域主要集中于淀山湖西部及北部的主要支流入湖口区域,表明这些入湖支流是总磷的主要来源。此外,船只活动区域也与总磷浓度高值区域有较高的一致性,船只活动可能是总磷的另一个重要来源。氨氮浓度高值区域出现在西部和北部水域,中部水域氨氮浓度较低。叶绿素a浓度在主要入湖支流口附近相对较低,空间分布上呈现出北高南低、东高西低及岸边高、中心低的空间分布,与水生植物空间分布具有较高的一致性。
(3) 通过广义线性混合模型对淀山湖水质空间分布进行溯源,结果表明,入湖支流、动力船只、农田和水生植物对淀山湖总磷、氨氮和叶绿素a浓度的分布均有显著影响,其中入湖支流的影响最大。
综上所述,天空地一体立体水质监测网络为淀山湖的水质监测提供了有效的手段,揭示了水质参数的空间分布特征和主要影响因素,为制定科学合理的水环境治理方案提供了重要参考和科学依据。
[1] |
陈水勇, 吴振明, 俞伟波, 等. 水体富营养化的形成、危害和防治[J]. 环境科学与技术, 1999(2): 11-15. |
[2] |
刘君, 戚浩强, 黄奔, 等. 基于多源卫星数据的淀山湖富营养化时空分布研究[J]. 红外, 2023, 44(3): 36-41. |
[3] |
卢嘉, 李小平, 陈小华. 淀山湖总氮和总磷的时空模拟分布[J]. 环境监测管理与技术, 2010, 22(6): 32-38. DOI:10.3969/j.issn.1006-2009.2010.06.007 |
[4] |
季铁梅, 姚勇华, 葛婷婷, 等. 基于Sentinel-2遥感数据的上海市河道水质参数反演研究[J]. 红外, 2023, 44(11): 42-50. |
[5] |
姜丙波, 杨帅, 詹国旗, 等. 基于Landsat 8数据的广东石马河流域水质参数反演研究[J]. 测绘通报, 2024(S1): 191-195. |
[6] |
李欢, 万玮, 冀锐, 等. 中国卫星遥感地表水资源监测能力分析与展望[J]. 遥感学报, 2023, 27(7): 1554-1573. |
[7] |
钱楚仪. 叶绿素遥感反演研究[D]. 上海: 上海海洋大学, 2022.
|
[8] |
张勇, 王慧, 朱传华, 等. 基于机器学习的卫星遥感水质富营养化评价——以合肥市环城河为例[J]. 华东师范大学学报(自然科学版), 2024(1): 1-8. DOI:10.3969/j.issn.1000-5641.2024.01.001 |
[9] |
CARPENTER D J, CARPENTER S M. Modeling inland water quality using Landsat data[J]. Remote Sensing of Environment, 1983, 13(4): 345-352. DOI:10.1016/0034-4257(83)90035-4 |
[10] |
YANG Z, REITER M, MUNYEI N. Estimation of chlorophyll-a concentrations in diverse water bodies using ratio-based NIR/Red indices[J]. Remote Sensing Applications: Society and Environment, 2017(6): 52-58. |
[11] |
王云霞, 杨国范, 林茂森, 等. 基于landsat卫星影像的水库水体总磷质量浓度反演研究[J]. 灌溉排水学报, 2017, 36(4): 105-109. |
[12] |
鲁婉婷, 徐攻博, 王昱, 等. 基于北京二号卫星影像与同步实测数据的椒江入海口水质遥感反演[J]. 杭州师范大学学报(自然科学版), 2023, 22(2): 218-224. |
[13] |
黎栩霞, 王裕东, 肖佑鹏, 等. 深圳近岸海域水质遥感监测及时空变化[J]. 环境工程, 2024, 42(1): 243-252. |
[14] |
林剑远, 张长兴. 航空高光谱遥感反演城市河网水质参数[J]. 遥感信息, 2019, 34(2): 23-29. |
[15] |
王波, 黄津辉, 郭宏伟, 等. 基于遥感的内陆水体水质监测研究进展[J]. 水资源保护, 2022, 38(3): 117-124. |
[16] |
张乐, 雷金睿, 陈毅青, 等. 基于无人机多光谱数据的水质参数反演与评价——以海口市永庄水库为例[J]. 中国环境科学, 2023, 43(S1): 258-267. |
[17] |
朱熹, 刘黎明, 叶张林. 无人机水质遥感监测方法[J]. 中国水运, 2021(7): 157-159. |
[18] |
毛德华, 周滢, 周懿琳. 1990—2016年湘江流域水质时空变化及驱动因素分析[J]. 环境科学, 2024, 45(7): 3953-3964. |
[19] |
郑亚利, 胡雪峰, 陆思文, 等. 淀山湖水质及与环湖稻田农业面源污染的关系[J]. 上海大学学报(自然科学版), 2021, 27(6): 1056-1064. |
[20] |
周游, 冯芳, 金爽, 等. 京杭大运河水质时空分布特征及驱动因素[J]. 环境科学学报, 2024, 44(6): 174-184. |
[21] |
张骁, 吴心艺, 徐义桦, 等. 淀山湖"一湖一策"水环境保护及治理浅析[J]. 山西水利科技, 2024(1): 66-69. |
[22] |
张琪. 淀山湖浮游植物生态种组季节动态及其影响因子[D]. 上海: 华东师范大学, 2016.
|
[23] |
张前平. 环淀山湖水域经济发展中航道管理研究[D]. 上海: 华东政法大学, 2014.
|
[24] |
SÒRIA-PERPINYÀ X, VICENTE E, URREGO P, et al. Remote sensing of cyanobacterial blooms in a hypertrophic lagoon(Albufera of València, Eastern Iberian Peninsula) using multitemporal Sentinel-2 images[J]. Science of The Total Environment, 2020, 698: 134305. |
[25] |
李小勇, 黄鹏, 孙武, 等. 基于Sentinel-2影像的横山水库叶绿素a反演算法研究[J]. 水利科学与寒区工程, 2023, 6(11): 93-96. |
[26] |
刘轩, 赵同谦, 蔡太义, 等. 丹江口水库总氮、氨氮遥感反演及时空变化研究[J]. 农业资源与环境学报, 2021, 38(5): 829-838. |
[27] |
吴瑞姣. 基于BP-SVR混合模型的古田水库总磷浓度遥感反演[J]. 福建地质, 2023, 42(3): 224-230. |
[28] |
邹志科, 余蕾, 张煜, 等. 基于Sentinel 2-L1C的江汉平原水产养殖区水质参数反演[J]. 长江科学院院报, 2023, 40(9): 181-187. |
[29] |
沈蔚, 纪茜, 邱耀炜, 等. 基于高光谱遥感的长江口叶绿素a浓度反演推算[J]. 水生态学杂志, 2021, 42(3): 1-6. |
[30] |
AKAIKE H. A new look at the statistical model identification[J]. IEEE Transactions on Automatic Control, 1974, 19(6): 716-723. |