基于光学微波特征融合的新疆典型经济作物提取

 

针对异物同谱效应造成的作物提取精度不足问题,本研究提出了一种集成光学和微波特征的方法,通过特征融合提高作物提取精度。本研究基于Sentinel-1合成孔径雷达影像和Sentinel-2多光谱数据,对新疆巴州地区的典型绿洲农业区进行作物分类制图。为提高雷达数据提取特征的质量,采用SHP-DSI方法,对时间序列Sentinel-1数据的后向散射强度进行相干斑抑制,并对相干系数进行精确估计和去偏。...

针对异物同谱效应造成的作物提取精度不足问题,本研究提出了一种集成光学和微波特征的方法,通过特征融合提高作物提取精度。本研究基于Sentinel-1合成孔径雷达影像和Sentinel-2多光谱数据,对新疆巴州地区的典型绿洲农业区进行作物分类制图。为提高雷达数据提取特征的质量,采用SHP-DSI方法,对时间序列Sentinel-1数据的后向散射强度进行相干斑抑制,并对相干系数进行精确估计和去偏。此外,首次在研究中提取了合成孔径雷达干涉(InSAR)产品用于作物分类,包括干涉相干系数,主从影像后向散射强度比和从SAR时间序列的振幅色离散度指数等。为探索红边特征在绿洲作物类型识别中的作用,本研究提取了Sentinel-2的3个红边波段并导出了11个红边指数,结合常规的多光谱特征,与雷达特征进行集成,以提高作物分类的精度。 为了处理高维特征,获取SAR和光学特征的最优组合,本研究提出了一种半自动化的特征筛选流程,基于随机森林算法的特征重要性排序以及递归特征增量(Recursive Feature Increment,RFI)算法对所有特征进行筛选,以达到最高的作物分类精度。本研究发现Sentinel-2的红边特征将作物分类精度提高了3.06%。在对比实验中本研究证实了时间序列Sentinel-1和Sentienl-2的特征融合在作物分类中可实现最高精度。

原文链接

Sun, L., Chen, J., Guo, S., Deng, X., & Han, Y. (2020). Integration of Time Series Sentinel-1 and Sentinel-2 Imagery for Crop Type Mapping over Oasis Agricultural Areas. Remote Sensing, 12(158), 1–27.

研究背景

新疆是我国西北干旱半干旱地带的主要农业区。由于气候干燥,新疆的农业生产几乎完全依靠灌溉,导致水资源匮乏问题更加严重。新疆地区是我国棉花的主要产区,种植面积大,棉花品质较好,是国内棉花供给的重要支柱。2017年,新疆棉花种植面积占全国比重超过60%;棉花产量占全国比重超过70%。此外,棉花种植和其他农作物相比,需要大量的水源进行浇灌,加快了土地荒漠化的速度。新疆一些地区历经数次农业结构调整,实行“退白扩红”战略,大量种植辣椒和番茄,因此种植结构更加复杂,需要更加及时和精确的农作物种类分布制图。农作物种类分布是进行水资源和环境承载力估计所需的重要信息。在我国西北干旱半干旱地区,农业是支柱产业而生态环境相对较为脆弱,因此更为重要。随着空间技术的发展,遥感技术以已被应用到大范围的农作物种植面积、长势监测中,具有宏观、准确、及时等优点,监测结果可为国家农业生产管理、粮食政策制定提供重要参考依据。

近年来,遥感技术被广泛应用于农作物种植面积监测及作物分类中。原来主要使用的是光学遥感影像,利用不同种类作物之间的物候期差异,通过植被指数的时间变化来进行某种作物的提取。有些研究采用MODIS植被指数时间序列进行作物分类,但是由于分辨率太低,不适用于地块尺寸小、异构性强的小农种植系统 。对于地块破碎、异构性强的种植区,中、高分辨率影像(30米以内)是更为合适的选择。此前也有不少研究采用Landsat NDVI时间序列进行作物提取、分类,但是由于Landsat重访周期较长,在作物生长关键期受频繁的云雨天气影响无法获取完整、连续的光学数据,严重影响监测的有效性 。Sentinel-2卫星的发射为遥感监测提供了较高时空分辨率的光学数据,重访周期为10天,分辨率达到10米,在小农种植系统的农作物种植面积、长势监测、作物分类等应用中具有较大的潜力 。但是,由于光学数据本身的特点,受云的影响,Sentinel-2在作物关键生长期的数据连续性仍然不能保证 。此外,对于具有相似物候周期的作物类型,只依靠光谱信息不足以进行区分。

星载合成孔径雷达(SAR)遥感具有全天时、全天候、覆盖范围广、穿透能力强的特点,能够反映植被的结构特征与介电特性,已越来越多地用于遥感作物分类。Silva等在巴西热带半干旱地区采用L波段机载SAR影像研究了单/双/全极化SAR后向散射强度进行作物分类的潜力,发现增加极化通道可大幅度提高作物分类的精度 。还有研究表明,对于单极化和双极化SAR,使用多时相数据可以提高作物分类的准确性,其中采用交叉极化的后向散射系数其分类精度优于其他极化模式。随着Sentinel-1 A和B卫星的发射,可免费获取的SAR数据量显著增加,该数据具有双极化模式,双星6天单轨12天的重访周期和20米的空间分辨率,这对于中高分辨率的作物分类是目前较为理想的SAR数据源。然而,受SAR成像系统固有的相干斑噪声影响,单独采用SAR影像进行棉花提取的精度较低 。现有技术对SAR数据后向散射强度的相干斑抑制效果不理想,由于采用本地规则窗口进行滤波,没有考虑周边像素的统计特性,在抑制噪声的同时极易模糊强散射体与周边低相干区域。此外,大部分研究只关注雷达后向散射强度,没有对SAR影像的其他特征在作物分类中的作用进行评估。

可见光遥感影像受云的影响难以得到长时间序列影像,SAR影像具有全天时、全天候工作的优点,可提供长时间序列数据弥补这一不足,且光谱和SAR影像由于传感器和成像机理的不同,在地物解译方面有互补作用 。如何结合光学数据和SAR数据进行综合处理,对作物种类进行精确分类和提取,成为研究的热点。

本研究提出了一种集成Sentinel-1合成孔径雷达影像和Sentinel-1多光谱数据的方法,对新疆巴州地区的典型绿洲农业区进行作物分类制图。为提高雷达数据提取特征的质量,本研究采用SHP-DSI方法,对时间序列Sentinel-1数据的后向散射强度进行相干斑抑制,并对相干系数进行精确估计和去偏。此外,首次在研究中提取了合成孔径雷达干涉(InSAR)产品用于作物分类,包括干涉相干系数,主从影像后向散射强度比和从SAR时间序列的振幅色离散度指数等。为探索红边特征在绿洲作物类型识别中的作用,本研究提取了Sentinel-2的3个红边波段并导出了11个红边指数,结合常规的多光谱特征,与雷达特征进行集成,以提高作物分类的精度。为了处理高维特征,获取SAR和光学特征的最优组合,本研究提出了一种半自动化的特征筛选流程,基于随机森林算法的特征重要性排序以及递归特征增量(Recursive Feature Increment,RFI)算法对所有特征进行筛选,以达到最高的作物分类精度。本研究发现Sentinel-2的红边特征将作物分类精度提高了3.06%。在对比实验中本研究证实了时间序列Sentinel-1和Sentienl-2的特征融合在作物分类中可实现最高精度。

模型方法介绍

本研究中使用的工作流程如图 3.6.2所示。

image.png

图 3.6.2实验流程

  1. 基于Sentinel-1数据提取SAR和InSAR特征 对时间序列Sentinel-1 IW SLC数据进行预处理,包括精配准、镶嵌、裁剪。为提高SAR和InSAR特征的信噪比,基于Gamma置信区间判别从时序SAR数据中提取统计同质像元(SHP),并采用SHP-DSI算法进行相干斑滤波,在此基础上提取SAR和InSAR特征。
  2. **基于Sentinel-2**数据提取多光谱特征
    对多时相Sentinel-2数据进行预处理,采用sen2cor软件将L1C级Top of Atmosphere (TOA)产品转换为L2A级产品表面反射率(surface reflectance),提取10米、20米分辨率的所有谱段(包括B2, B3, B4, B5 B6, B7, B8, B8A, B11, B12);并计算植被指数、水体指数、红边指数等
  3. 雷达和光学特征融合
    基于随机森林(Random Forest,RF)算法对所有特征进行重要性排序,在此基础上采用递归特征增加(Recursive Feature Increment,RFI)方法选取最优特征组合,进行土地覆盖分类,获取农田掩膜;在农田掩膜范围内,进行作物分类,得到作物分类制图。

试验结果

采用基于统计同质像素(SHP)的SHP-DSI 算法对SAR影像进行相干斑抑制和相干系数估计,结果如下:

image.png

图3.6.3 SAR后向散射强度图 (a)原始强度图; (b) Refined Lee算法滤波后强度图;(c) SHP-DSI算法滤波后强度图

image.png

图3.6.4干涉相干系数 (a) 常规7*7滑窗估计的干涉相干系数;(b) SHP-DSI 算法估计的干涉相干系数

3.6.6采用不同方法处理后的SAR&InSAR特征进行作物分类的精度

  Mean OA Kappa Coefficient F1-score chili F1-score corn F1-score cotton F1-score pear F1-score tomato
Original 60.20% 0.48 0.55 0.33 0.67 0.72 0.58
Refined Lee 73.21% 0.65 0.66 0.52 0.80 0.83 0.74
SHP DSI 79.46% 0.73 0.75 0.60 0.88 0.86 0.77

从表3.6.6中可以看到,采用SHP-DSI算法较原始数据和常规Refined Lee算法滤波后提取的SAR和InSAR特征在作物分类制图中显著提高了精度,无论是总体精度(OA)、Kappa系数,还是每一个作物种类的F1-sore都有显著提高。采用随机森林算法进行一级类分类以提取农田,并采用分层交叉验证(K=10份)方法对总体精度和农田提取精度进行验证,结果如下:

image.png

3.6.5(a) 土地覆盖分类结果;(b) 农田掩膜

image.png

3.6.6雷达和光学特征集成获取的作物种类制图

对比只使用SAR特征,只使用光学特征,以及SAR和光学特征的最优组合分别进行作物分类制图,精度对比如下:

3.6.9分别采用Sentinel-1、Sentinel-2常规多光谱特征、Sentinel-2包括红边特征在内的所有光学特征、Sentinel-1&2集成特征的作物分类制图精度对比

  Number of features Mean OA Kappa Coefficient
Sentinel-1 133 79.46% 0.73
Sentinel-2 without red-edge features 58 82.37% 0.77
Sentinel-2 104 85.43% 0.81
Sentinel-1 & Sentinel-2 113 86.98% 0.83

表3.6.9说明,Sentinel-2的红边特征对比常规多光谱特征,将作物分类的OA提高了3.06%,Kappa系数提高了0.04;Sentinel-1雷达和Sentinel-2光学特征融合后,总体精度(OA)和Kappa系数比单独使用雷达或光学特征都有显著提高。

对比分别采用Sentinel-1、Sentinel-2常规多光谱特征、Sentinel-2包括红边特征在内的所有光学特征、Sentinel-1&2集成特征的每种作物类别的提取精度如图3.6.7所示。

image.png

3.6.7不同特征组合下不同种类作物的提取精度对比

从图3.6.7中本研究可以发现,对于辣椒和玉米,红边特征对提取精度的提高较显著;对于棉花和香梨,只采用Sentinel-1雷达特征时,各自的提取精度已经很高,Sentinel-2多光谱特征的加入又进一步提高了提取精度;对于番茄的提取,采用雷达特征、常规多光谱特征、红边特征的提取精度是一样的,雷达和光学特征的集成才显著提高了提取精度。查看每种作物的提取精度对比,共同点是,采用Sentinel-1&2集成特征时,辣椒、玉米、棉花、香梨、番茄每种作物的提取F1-score都是几个特征组合中最高的。

结论

本研究通过西北某小农区的案例研究,提出了一种协同利用 Sentinel-1 和 Sentinel-2 特征进行绿洲作物类型测绘的方法。首先,引入了 SHP DSI 算法,对 SAR 强度进行去斑处理,准确估计干涉测量相干性,提高 SAR 特征的质量。研究表明,在仅使用 SAR 特征的情况下,使用 SHP DSI 方法可使作物分类精度提高 6.25%。从多时态的 Sentinel-1 和 Sentinel-2 图像中得到了多种 SAR 特征和光学特征,包括几种 InSAR 产品和红边光谱波段和指数。其次,根据随机森林分类器的换元重要性,提出了一种递归特征增量特征选择方法,得到 Sentinel-1和 Sentinel-2 特征的最优组合,用于农田提取和作物类型分类。最后,生成了作物分布图,总体精度为 83.22%, kappa 系数为 0.77。对 SAR 和光学特征的贡献进行了深入探讨。在所有 Sentinel-1 特征中,VH 强度所占比例最大,说明 VH 偏振对植被变化的敏感性较好。同时,还注意到 InSAR 的一些产品,如 VH 振幅色散、主从强度比、 4 月上旬的 VV相干性等,揭示了某些作物类型的良好分离性。至于 Sentinel-2 特征,我们证明了在绿洲作物类型测绘中使用红边光谱波段和指数的优点。与仅使用传统光学特征相比,红边特征的加入使作物分类 OA提高了 1.84%。这证明了 Sentinel-2 数据的优越性,因为光谱分辨率的提高。对使用 4 种特征组合的绿洲作物分类性能进行了比较。结果表明, SAR 和光学特征的集成取得了最佳性能。我们认为,时间序列 S1 和 S2 图像的集成具有优势,由于数据的免费、充分和开放政策,可以在绝大多数地区进一步探索用于作物状况监测。