基于机器学习遥感算法的大型漂浮藻面积提取方法研究
李兆鑫1, 丘仲锋1, 李旭文2, 姜晟2, 张悦2     
1. 南京信息工程大学海洋科学学院,江苏  南京  210044;
2. 江苏省环境监测中心,江苏  南京  210019
摘要: 采用基于机器学习的多层感知机算法,利用GOCI(Geostationary Ocean Color Imager)传感器获取的瑞利校正反射率数据,对东中国海大型漂浮藻进行遥感自动识别,采用线性混合像元分解来计算大型漂浮藻的覆盖面积,并利用膨胀和侵蚀法进行大型漂浮藻的分布面积计算。利用L8/OLI(Landsat 8/ Operational Land Imager)高空间分辨率资料进行验证,结果表明,基于机器学习遥感算法针对GOCI提取的大型漂浮藻覆盖面积,与L8/OLI结果十分接近,R2达到0.959,平均绝对误差和平均相对误差分别为39.32 km2和18.15%。
关键词: 大型漂浮藻    机器学习    地球静止海洋水色成像仪    遥感    
Study on Area Extraction Method of Floating Macroalgae Based on Machine Learning Remote Sensing Algorithm
LI Zhao-xin1, QIU Zhong-feng1, LI Xu-wen2, JIANG Sheng2, ZHANG Yue2     
1. School of Marine Sciences, Nanjing University of Information Science & Technology, Nanjing, Jiangsu 210044, China;
2. Jiangsu Provincial Environmental Monitoring Center, Nanjing, Jiangsu 210019, China
Abstract: This paper used the multi-layer perceptron algorithm based on machine learning, aiming at the Rayleigh corrected reflectance data obtained by GOCI (Geostationary Ocean Color Imager), to achieve the remotely automatic identification of floating macroalgae in the eastern China sea, and used the linear mixed pixel decomposition to calculate the coverage area and also used the methods of dilation and erosion to derive the distribution area of floating macroalgae. High spatial resolution data of L8/OLI (Landsat 8/ Operational Land Imager) were used to verify the proposed algorithm. The results showed that the coverage area of floating macroalgae extracted using GOCI based on machine learning remote sensing algorithm in this paper had a good agreement with that of L8/OLI, with R2 reaching 0.959, MAE and MRE approaching 39.32 km2 and 18.15%, respectively.
Key words: Floating macroalgae    Machine learning    GOCI    Remote sensing    
0 引言

2008年奥帆赛青岛海域的浒苔事件,让我国近海的大型漂浮藻开始得到前所未有的关注,大型漂浮藻主要包括浒苔和马尾藻,近年来频频发生,对海洋渔业、海洋经济、海洋生态环境等产生了严重的影响。为了减少和控制大型漂浮藻暴发带来的损失和影响,首先要实现对其大范围快速探测。

与传统的船舶等现场观测相比,卫星遥感监测具有大范围同步快速观测等优势,可以迅速获取大型藻类暴发的时间、分布和覆盖范围,以及漂移路径等有价值的信息,提高大范围灾情分析的准确度,以便在短时间内控制其发展趋势,最大程度减少经济损失。

针对中国近海频发的大型漂浮藻遥感探测,国内外学者开展了大量研究,大多采用指数阈值法,即利用卫星数据得出特定指数并采用阈值进行分割,从而提取研究区域的藻类信息。例如,Hu等[1]使用归一化植被指数(Normalized Difference Vegetation Index,NDVI)基于MODIS 250 m分辨率的图像数据成功识别出了2008年黄海发生的浒苔聚集现象。为了提升藻类识别算法的稳定性,Hu[2]于2009年提出了基于光谱基线差异的漂浮藻类指数(Floating Algal Index,FAI),分析表明FAI相比传统的NDVI更稳定,更适合用于多变大气环境下的藻类识别。随后,基于相同的算法设计思路,Xing等[3]针对HJ-1卫星提出了漂浮藻类高度虚拟基线指数(Virtual-Baseline Floating macro Algae Height,VB-FAH),分析了1995—2006年、2009—2014年黄海和东海多年的大型藻类暴发情况。Son等[4]提出了针对地球静止海洋水色成像仪(Geostationary Ocean Color Imager,GOCI)传感器的漂浮绿潮指数(Index of floating Green Algae for GOCI,IGAG),并应用于中国黄海、东海及韩国西部海岸浒苔灾害的监测。张海龙等[5]基于GF1-WFV和HJ-CCD卫星数据提出了多光谱绿潮指数(Multispectral Green Tide Index,MGTI),成功实现了对我国近海浒苔的遥感监测。蒋兴伟等[6]发展了面向对象的浒苔提取方法,通过调整影像的分割尺度来提取浒苔信息,总体精度达到了90.38%。

但在实际应用中,云雾、气溶胶和太阳耀斑等因素都会对遥感算法的特定指数造成影响,导致使用单一阈值不能从影像有效地识别实际环境中的藻类信息。针对这一情况,近年来兴起的机器学习方法可能是一种有效解决手段。Qiu等[7]针对GOCI卫星数据,发展了一种基于像元级别分类的多层感知机(Multi-Layer Perceptron,MLP)大型漂浮藻遥感算法。现基于Qiu等发展的机器学习算法,对中国近海的大型漂浮藻开展了面积分布特征提取方法研究。

1 研究区域与数据

研究区域见图 1。东中国海从北至南由渤海、黄海及东海组成,其东北毗邻朝鲜半岛,通过对马海峡与日本海相接。水深通常在100 m以内,海底地形复杂,东海的东南侧为冲绳海槽,水深超1 000 m。

图 1 研究区域

所用卫星遥感数据来自于GOCI,是韩国海洋卫星中心于2010年6月26日发射的首颗地球同步轨道海洋气象卫星上搭载的传感器之一。数据空间分辨率为500 m,时间分辨率为1 h(全天提供8景图像数据,时段为北京时间08: 15—15: 15)[8],对地观测以韩国(130 °E,36 °N)为中心,2 500 km×2 500 km范围的区域,见图 2。获取时间为世界时2019年3月16日03: 16: 43, 获取自KOSC官网(http://kosc.kiost.ac.kr/)。GOCI设置了8个波段,包括6个可见光波段和2个近红外波段,光谱范围为400~900 nm。

图 2 GOCI真彩色RGB合成图(R: B6, G: B4, B: B1)

从KOSC官网(http://kosc.kiost.ac.kr/)下载Level-1B(L1B)数据,使用GDPS(GOCI Data Processing System, Version 1.4.1)软件对L1B数据进行区域裁剪和大气校正处理[8-9]。GOCI标准的大气校正算法参考了SeaWiFS(Sea-viewing Wide Field-of-view Sensor)的算法[10],通过其中的气体吸收校正、海面白帽校正及瑞利校正后获得瑞利校正反射率Rrc(Rayleigh-corrected reflectance)。

2 机器学习遥感算法

研究采用与Qiu等[7]相同的方法进行漂浮藻的信息提取,即基于像元级别分类的机器学习算法—多层感知机MLP(Multi-Layer Perceptron)对卫星数据进行处理。MLP是经典机器学习算法之一,其本质上是监督分类中的正反馈人工神经网络[11-12]

藻类图像识别模型建立的具体流程如图 3所示,修改自Qiu等[7]。算法分为2个阶段:第1阶段,将准备好的各类别样本光谱按7:3的比例分为训练集和测试集,将全波段的Rrc作为输入MLP的参量,训练出的模型记为A; 第2阶段引入空间差异SD(Spatial Difference)特征量,即5×5像元窗口内中心像元的Rrc与窗口内其他像元Rrc差值的平均(SDmean),计算出各潜在大型藻像元在8个波段上的SD,并以此为输入训练出模型B。最后,将模型B认为是非大型藻的像元同样归为其他类,完成模型A和B识别结果的统一,得到最终的分类图像。

图 3 藻类图像识别模型建立的具体流程

根据Qiu等[7]的研究,MLP模型能在不同观测条件下有效地检测出东中国海的漂浮大型藻类,与独立数据验证及光谱验证结果表明,整体识别精度达90%左右,且与传统的指数算法相比具有更高的稳定性。

3 覆盖面积计算

漂浮大型藻的覆盖面积Sc(coverage area)指实际覆盖的区域,通过将大型藻像元的数量与像元实际面积相乘所得。在GOCI遥感图像中,大型藻像元大多是混合像元,卫星获取的信息同时包含了藻类和海水的贡献。对于这种情况,通常计算出卫星获取信息中藻类和海水的贡献比,然后据此计算藻类实际所占的像元面积。常用基于线性混合像元分解法[13-15]进行藻类覆盖面积的估算,见公式(1)—(4)。

$ {R_{{\rm{rc}},i}} = {{\rm{ \mathsf{ α} }}_i}{R_{{\rm{rc}},{\rm{ma}}}} + \left( {1 - {\alpha _i}} \right){R_{{\rm{rc}},{\rm{sw}}}} $ (1)

式中:i——第i个大型藻混合像元; ma——大型藻(Macroalgae); sw——海水(Sea water); α——混合像元中藻类的占比(又可称为空间覆盖率)。

由于替代浮藻指数(alternative floating algae index, AFAI)对藻类像元有较好的一致性,这里引入AFAI[13]来描述藻类像元,计算见公式(2)。

$ \begin{array}{*{20}{c}} {{\rm{AFAI}} = {R_{{\rm{rc}},{\rm{NIR}}}} - \left[ {{R_{{\rm{rc}},{\rm{BED}}}} + \left( {{R_{{\rm{rc}},{\rm{LNIR}}}} - {R_{{\rm{rc}},{\rm{RED}}}}} \right)} \right.}\\ {\left. {\left( {{\lambda _{{\rm{NIR}}}} - {\lambda _{{\rm{RED}}}}} \right)/\left( {{\lambda _{{\rm{LNR}}}} - {\lambda _{{\rm{RED}}}}} \right)} \right]} \end{array} $ (2)

式中:RED、NIR及LNIR——红光、近红外及长波近红外波段; 对于GOCI数据,λRED——660 nm,λNIR——745 nm,λLNIR——865 nm。

根据AFAI,可以计算出每个混合像元的α,如公式(3)所示。若某个像元的AFAI=AFAIsw,计算出的α=0,说明该像元无大型藻覆盖,为纯海水像元; 同理,当某个像元的AFAI=AFAIma时说明该像元完全由大型藻覆盖,为纯大型藻像元。当AFAI在二者之间时,通过线性方程计算出对应的α。最终,GOCI图像中大型藻的覆盖面积(Sc)可以由公式(4)计算得到。

$ {\alpha _i} = \frac{{{\rm{AFA}}{{\rm{I}}_i} - {\rm{AFA}}{{\rm{I}}_{{\rm{sw}}}}}}{{{\rm{AFA}}{{\rm{I}}_{{\rm{ma}}}} - {\rm{AFA}}{{\rm{I}}_{{\rm{sw}}}}}} \times 100\% $ (3)
$ {{S}_{c}}=\sum\limits_{i=1}^{N}{{{\alpha }_{i}}}\times 0.5\times 0.5\times \cos \left( {{35}^{{}^\circ }} \right) $ (4)

式中:Sc——大型藻的覆盖面积,km2; N——图像中大型藻像元的总数。

在该算法中,AFAIsw和AFAIma对覆盖面积的计算有直接的影响,是线性分解的上下界。通常根据所用的卫星数据进行纯像元Rrc光谱的模拟,从而确定数值。然而,目前鲜有针对GOCI数据的研究,缺乏前人的经验。针对这种情况,采用统计方法来确定适用于GOCI的AFAIsw和AFAIma。首先,从14景图像的识别结果中提取出其他类像元,由其Rrc计算归一化水体指数(Normalized Difference Water Index, NDWI)[16],根据NDWI>0分离出海水像元,见图 4。插图为其他类像元光谱计算NDWI频率分布。其次,计算出识别结果中大型藻像元和海水像元AFAI的累计频率分布,找出两频率曲线相差最大的位置,见图 4红色虚线。最终,确定所使用的AFAIsw为-0.1×10-2,约占海水频率曲线的95.4%,大型藻频率曲线的3.6%,再根据大型藻频率曲线的99.9%确定出AFAIma为8.0×10-2

图 4 海水像元和大型藻像元光谱计算的AFAI累计频率分布

由于大范围藻类覆盖面积的实测数据难以获得,为验证算法的可行性,以同步的高空间分辨率Landsat-8 OLI图像数据作为“真实值”,与结果进行对比验证。10景与GOCI同步观测的Landsat-8 OLI图像信息见表 1,数据获取的时间相差不超过20 min,视为此时段内大型藻的分布未出现明显变化。对L8/OLI图像进行人工目视解译等方法得到图中的大型藻像元分布,直接累加计算作为“真实”的覆盖面积。

表 1 10景与GOCI同步观测的Landsat-8 OLI图像数据信息
编号 获得时间 Landsat 8 OLI GOCI
扫描时间(世界时) 轨道号(行/列) 扫描时间(世界时)
1 2016-06-16 02:35:52 120/35 02:16:44
2 2016-06-16 02:36:16 120/36 02:16:44
3 2016-06-25 02:29:23 119/34 02:16:42
4 2016-06-25 02:29:46 119/35 02:16:42
5 2016-06-25 02:30:10 119/36 02:16:42
6 2016-07-02 02:36:01 120/35 02:16:42
7 2017-5-27 02:29:33 119/35 02:16:42
8 2017-05-27 02:29:57 119/36 02:16:42
9 2017-05-29 02:18:00 117/37 02:16:40
10 2017-05-29 02:18:24 117/38 02:16:40

为系统地评估面积估计的精确度,计算了平均绝对误差(Mean Absolute Error, MAE)和平均相对误差(Mean Relative Error, MRE),见公式(5)和(6),并利用二者线性拟合时获得的决定系数(R2)来表征面积估计值与真实值的相关程度。

$ {\rm{MAE}} = \frac{1}{N}\sum\limits_{i = 1}^N {\left| {S_c^{es} - S_c^{tr}} \right|} $ (5)
$ {\rm{MRE}} = \frac{1}{N}\sum\limits_{i = 1}^N {\left| {\frac{{S_c^{es} - S_c^{tr}}}{{S_c^{tr}}}} \right|} \times 100\% $ (6)

式中:上标“es”和“tr”——Sc的估计值和真实值; N——匹配图像的数量。

对比结果见图 5所示,二者的趋势十分接近,R2达到0.959,MAE和MRE分别为39.32 km2和18.15%。同时也可以看出,GOCI计算的Sc偏<Landsat-8 OLI,平均低估值约36.53 km2。分析其原因可能是GOCI图像难以识别到更小尺度的漂浮大型藻,特别是在藻类暴发初期。

图 5 Landsat-8 OLI与GOCI计算的覆盖面积对比散点分布

4 分布面积计算

漂浮大型藻的分布面积Sd(distribution area)指大型藻所能影响的范围。分布面积提取的实际操作中,研究者经常在大型藻分布图上进行人工圈定,导致结果依赖于专家经验。本研究利用膨胀和侵蚀方法,在MLP模型的识别图中,自动提取大型藻类的分布范围并计算分布面积。膨胀和侵蚀是图像形态学中的基本运算操作,具体是通过特定尺寸和形状的卷积核对图像中所有像元点进行卷积运算,之后即可获得处理过后的图像。对于膨胀操作,处理过后的图像中各像元点的值为卷积运算时窗口内的最大值; 相反,侵蚀操作后图像像元点对应的是最小值[17]

计算分布面积的核心思路为,通过膨胀操作连通邻近的大型藻像元斑块,再使用侵蚀操作将向外膨胀的边缘区域收缩回原本的状态,以避免面积的高估。具体流程如下:(1)从MLP模型生成的多分类结果图中提取出大型藻分布的二值图(即大型藻像元为1,其他像元为0);(2)对二值图进行像元窗口尺寸为31×31的高斯低通滤波,减少误判产生的噪声大型藻像元对分布面积的影响; (3)对经过筛选的二值图,以21×21像元尺寸的圆形(disk)结构卷积核进行膨胀操作,之后再以19×19像元尺寸的圆形结构卷积核进行侵蚀操作,完成分布范围的提取; (4)计算分布范围内的像元总数,乘以单个像元的面积[0.25×cos(35°) km2],求得Sd

需要强调的是,以往分布范围的圈定往往是专家依靠其主观经验确定出藻类像元的外包络线,所以本算法的结果与以往公布的数值并无实际的可比性。本算法的重点在于使用一套明确且固定的流程自动地提取漂浮藻的分布范围并计算出面积,实现快捷计算的同时保证所得结果尽量贴合观察者目视的实际效果。

2017年3—4月发生在浙江近海的大型漂浮藻分布情况见图 6,图中分别用ScSd显示了大型藻类的覆盖和分布面积。可以看出,所提取出的Sd很好地符合了视觉特征,包裹着藻类像元(红色)的粉色区域表征其分布范围,能够直观地了解图像中大型漂浮藻暴发的影响程度。结果表明,2017年3月浙江沿海至杭州湾以东海域出现了明显的大型漂浮藻,该结果与Qi等[18]得出的结论相同,该文章同时指出该海域的藻类增长与近年浙江沿海紫菜养殖业发展导致的海水富营养化有关,导致3—4月该海域的大型漂浮藻处于增长期,同时由海面风的影响,漂浮藻呈现出向东北方向的漂移,最远可触及韩国济州岛南部海域。当然,图 6所示结果仅是该算法的简单展示,完整的演变过程需要将算法应用于更大范围的海域以及更长时间序列的图像数据中。

图 6 利用MLP模型探测的2017年3—4月浙江近海大型漂浮藻分布

总体而言,分布范围的自动提取效果良好,能够表现出藻类影响区域的变化,同时面积计算结果符合实际,说明藻类覆盖及分布面积遥感算法的合理性和有效性,有望对将来的研究或业务化使用提供一项参考。

5 结语

针对GOCI高时间分辨率遥感资料,利用Qiu等[7]发展的基于机器学习遥感算法,对发生在东中国海的大型漂浮藻进行遥感信息提取,并在此基础上开发出藻类覆盖面积和分布面积的提取算法。机器学习遥感算法可对东中国海各种复杂大气、水域环境下的大型漂浮藻进行自动识别。藻类覆盖面积算法采用线性混合像元分解模型,而藻类分布面积算法采用图像形态学中的膨胀和侵蚀方法,利用高空间分辨率遥感识别结果进行验证,所提方法的精度满足应用需要。针对GOCI的基于机器学习遥感算法模型和面积提取算法,有潜力应用于东中国海大型漂浮藻暴发事件的长期实时探测,并自动生成藻类面积数据产品,服务于海洋灾害监测与防治。

参考文献
[1]
HU C, HE M X. Origin and offshore extent of floating algae in Olympic sailing area[J]. Eos, 2008, 89(33): 302-303. DOI:10.1029/2008EO330002
[2]
HU C. A novel ocean color index to detect floating algae in the global oceans[J]. Remote Sensing of Environment, 2009, 113(10): 2118-2129. DOI:10.1016/j.rse.2009.05.012
[3]
XING Q, HU C. Mapping macroalgal blooms in the Yellow Sea and East China Sea using HJ-1 and Landsat data: Application of a virtual baseline reflectance height technique[J]. Remote Sensing of Environment, 2016, 178: 113-126. DOI:10.1016/j.rse.2016.02.065
[4]
SON Y B, MIN J E, RYU J H. Detecting massive green algae (Ulva prolifera) blooms in the Yellow Sea and East China Sea using Geostationary Ocean Color Imager (GOCI) data[J]. Ocean Science Journal, 2012, 47(3): 359-375. DOI:10.1007/s12601-012-0034-2
[5]
张海龙, 孙德勇, 李俊生, 等. 基于GF1-WFV和HJ-CCD数据的我国近海绿潮遥感监测算法研究[J]. 光学学报, 2016, 36(6): 1-9.
[6]
蒋兴伟, 刘建强, 邹斌, 等. 浒苔灾害卫星遥感应急监视监测系统及其应用[J]. 海洋学报, 2009, 31(1): 52-64. DOI:10.3321/j.issn:0253-4193.2009.01.007
[7]
QIU Z F, LI Z X, BILAL M, et al. Automatic method to monitor floating macroalgae blooms based on multilayer perceptron: case study of Yellow Sea using GOCI images[J]. Optics Express, 2018, 26(21): 26810-26829. DOI:10.1364/OE.26.026810
[8]
RYU J H, HAN H J, CHO S, et al. Overview of geostationary ocean color imager (GOCI) and GOCI data processing system (GDPS)[J]. Ocean Science Journal, 2012, 47(3): 223-233. DOI:10.1007/s12601-012-0024-4
[9]
AHN J H, PARK Y J, RYU J H, et al. Development of atmospheric correction algorithm for Geostationary Ocean Color Imager (GOCI)[J]. Ocean Science Journal, 2012, 47(3): 247-259. DOI:10.1007/s12601-012-0026-2
[10]
WANG M, GORDON H R. A simple, moderately accurate, atmospheric correction algorithm for SeaWiFS[J]. Remote Sensing of Environment, 1994, 50(3): 231-239. DOI:10.1016/0034-4257(94)90073-6
[11]
ATKINSON P M, TATNALL A R L. Introduction Neural networks in remote sensing[J]. International Journal of Remote Sensing, 1997, 18(4): 699-709. DOI:10.1080/014311697218700
[12]
MAS J F, FLORES J J. The application of artificial neural networks to the analysis of remotely sensed data[J]. International Journal of Remote Sensing, 2008, 29(3): 617-663. DOI:10.1080/01431160701352154
[13]
WANG M, HU C. Mapping and quantifying Sargassum distribution and coverage in the Central West Atlantic using MODIS observations[J]. Remote Sensing of Environment, 2016, 183: 350-367. DOI:10.1016/j.rse.2016.04.019
[14]
WANG M, HU C. On the continuity of quantifying floating algae of the Central West Atlantic between MODIS and VⅡRS[J]. International Journal of Remote Sensing, 2018, 39(12): 3852-3869. DOI:10.1080/01431161.2018.1447161
[15]
QI L, HU C, XING Q, et al. Long-term trend of Ulva prolifera blooms in the western Yellow Sea[J]. Harmful Algae, 2016, 58: 35-44. DOI:10.1016/j.hal.2016.07.004
[16]
XU H. Modification of normalised difference water index (NDWI) to enhance open water features in remotely sensed imagery[J]. International Journal of Remote Sensing, 2006, 27(14): 3025-3033. DOI:10.1080/01431160600589179
[17]
RISHIKESHAN C A, RAMESH H. An automated mathematical morphology driven algorithm for water body extraction from remotely sensed images[J]. ISPRS Journal of Photogrammetry and Remote Sensing, 2018, 146: 11-21. DOI:10.1016/j.isprsjprs.2018.08.014
[18]
QI L, HU C, WANG M, et al. Floating algae blooms in the East China Sea[J]. Geophysical research letters, 2017, 44(22): 11501-11509. DOI:10.1002/2017GL075525