应用关键词
高光谱图像;土壤含水量;小波变换;CARS-SPA算法;反演模型
背景
土壤含水量(Soil moisture content, SMC)作为地表与大气物质能量交换的中间介质,是地表植被、微生物和作物生长的重要物质因子。SMC在农业生产预测和质量因子中也发挥着重要作用。准确、快速地获取土壤含水量可为精准农林经营和发展提供重要依据。
传统SMC测量方案成本高、耗时长,且采集到的数据集所包含的信息有限,无法进行进一步的数据分析,因此对SMC与土壤反射率关系的测量受到了全球研究者的广泛关注。土壤的光谱反射率受到仪器误差和环境参数(如光、温度和湿度)的影响。因此,在建立模型之前,需要对采集到的光谱进行预处理。这些方法包括反射率的对数一阶微分法、反射率的平方根法、相对反射率法和九点移动加权平均法。虽然这些方法可以降低光谱中的背景噪声,但仍存在处理过程复杂、特征信息无法保留等问题。考虑到小波变换具有多分辨率、低熵、低频信号的特点,以及对随机信号的处理能力,本研究采用小波变换方法作为预处理方法。为了去除高频区域的噪声,该方法将信号分解为高频和低频部分。这样,处理后的数据保留了原始信号*突出的特征,达到了提高信噪比的目的。本文采用竞争自适应重加权采样算法(Competitive adaptive reweighted sampling algorithm, CRAS)和连续投影算法(Successive
projections algorithm, SPA)相结合的方法,从原始数据集中选取较少的波段作为反演因子,提高了反演模型的拟合度和精度。在这种情况下,简单线性回归和多元线性回归算法可以简化反演模型的复杂性和冗余度,提高预测效率,达到大面积预测SMC的目的。
本文的主要贡献如下:(1)进行数据采集,研究耕地土壤中SMC和光谱反射率的变化规律。(2)利用小波变换和CARS-SPA算法建立SMC的简单多元线性反演模型,具有较高的反演精度。
试验设计
本文的研究区域位于江苏省南京市江北新区椅山区域,共采集土壤样品117个,其中52个样品用于SMC检测,65个样品用于土壤反射光谱测量。南京农业大学邹修国团队利用GaiaSorter高光谱分选系统(江苏双利合谱)获取每个土样的高光谱影像,该系统配备了SpectraSENS高光谱数据采集软件和两个CCD像机。两个相机高度、扫描前向速度、曝光时间等参数如表1所示。
由于光照条件、空气湿度和光谱采集仪器等干扰因素,土壤反射率光谱容易受到噪声的影响。为了平滑波形,提高信噪比,本研究采用离散小波变换(Discrete wavelet transform, DWT)算法进行去噪。为了选择较少的波段作为回归方程的自变量,本研究采用CARS-SPA算法。图1展示了CARS算法的基本流程。
本研究采用简单线性回归以及多元线性回归模型对SMC进行估测,并以RMSE、R2、MAE作为评价标准。
表1 GaiaSorter高光谱分选系统参数
图1 CARS算法的基本流程
结论
原始波形在1000 ~ 1200 nm处存在明显的噪声。进行第1层到第7层小波变换后,由于去除了高频信号,频谱逐渐平滑。然而,频谱的一些敏感波段被删除了,例如,在第6层分解中仍然可以看到380 ~ 1000 nm之间的峰值,而在第7层分解中不可见。训练结果表明,在6层“db4”分解过程中取得了良好的平滑效果,与原始数据的相关系数为0.912。图2为全波段L6平滑图及其部分放大图。
图2 小波变换与降噪结果。L6全波段平滑图(a)和2002 ~ 2304 nm平滑效果图(b)
图3展示了部分采集到的SMC及其对应的反射率曲线。从图3可以看出如下规律:(1)光谱反射率值在380 ~ 1000 nm和1000 ~ 2530 nm波段呈先升后降的趋势,即在这两个波段处存在反射峰。此外,在近红外波段1000 ~ 1350 nm存在一个吸收谷。(2)在380 ~ 1000 nm范围内,光谱反射率随SMC的增加而逐渐减小。但在1000 ~ 2530 nm范围,这一规律不明显。SMC差异较大的光谱曲线一般符合光谱随SMC增大而减小的规律。
图3 不同SMC土壤反射率曲线
表2给出了CARS、SPA和CARS-SPA算法所选波段和RMSECV的比较。在表2中,使用CARS-SPA算法对光谱数据进行处理时,首先使用CARS对全波段进行滤波。在获得特征波段数据集后,利用SPA进行更详细的评估,*终获得*佳波长。当CARS和SPA算法单独处理全波段时,SPA算法构建的模型性能优于CARS算法,而采用CARS-SPA算法的模型的性能明显比前两个模型更准确。本研究结果表明CARS-SPA算法与CARS和SPA算法相比具有*少的特征数。因此,采用CARS-SPA算法不仅可以降低模型的复杂度,还可以提高模型的精度。
CARS算法首先优化124个波段,其中40个波段在695 ~ 796 nm之间,32个波段在1273 ~ 1474 nm之间。图4显示了使用SPA算法进一步在695 ~ 796 nm之间进行特征选择的结果。从图中可以看出,*终选择了7个波段,其中RMSECV*小的位置为778 nm,此时模型拟合效果*佳。*后选取波段695 nm、711 nm、736 nm、747 nm、767 nm、778 nm和796 nm作为反演模型的因变量。
表2 CARS-SPA算法建立模型的性能
图4 CARS-SPA算法在695 ~ 796 nm处SPA算法的波段选择结果。模型中包含的变量数(a)以及选定变量的索引(b)。
根据CARS-SPA的选取结果,首先对优选波长进行简单线性回归分析。部分简单线性反演模型及其精度结果如表3所示。反演模型的R2在0.63 ~ 0.66之间,RMSE在0.0082 ~ 0.0084之间,MAE在0.56 ~ 0.58%之间。为了提高模型的拟合精度,本文采用多元线性逐步回归建立反演模型。从表4可以看出,多元线性回归方程的R2较简单线性回归方程增大到0.75(公式2)。本研究确定由695 nm、711 nm、736 nm、747 nm、767 nm、778 nm、796 nm波段组成的多元线性反演模型用于准确地反演土壤水分信息。
表3 简单线性反演模型及其精度
表4 多元线性反演模型及其精度
作者信息
邹修国,博士,南京农业大学人工智能学院副教授,硕士生导师。
主要研究方向:动植物表型及智能种养殖技术(装备)、智能仪表及数字管理、水路无人驾驶、智能机器人。
参考文献:
Wu, T.H., Yu, J., Lu, J.X., Zou, X.G., & Zhang, W.T. (2020). Research on Inversion Model of Cultivated Soil Moisture Content Based on Hyperspectral Imaging Analysis. Agriculture, 10(292).
https://doi.org/10.3390/agriculture10070292