应用方向:
红薯缺陷的快速非破坏性检测和分类技术能够同时获取样品的光谱信息和空间信息,为红薯的品质评估提供了一种有效的工具。通过高光谱成像技术的应用,可以实现对红薯中的健康、**和病变样本的**鉴别,进而提高红薯加工和储存过程中的经济效益。
背景:
红薯是全球及中国重要的粮食作物之一,其富含淀粉、多种维生素、膳食纤维、蛋白质以及钙、磷、铁等无机盐,具备延缓衰老、增强**力和**等健康效益。然而,红薯的各类缺陷如**和病害,长期以来一直困扰着种植业和加工业。这些缺陷的红薯容易氧化腐烂,并可能感染其他健康红薯,从而造成严重的经济损失。目前,红薯缺陷的检测主要依赖于人工方法,这不仅耗时耗力,而且准确性不高。尽管基于可见光图像的机器视觉系统已广泛应用于果蔬缺陷检测,但在可见光图像中难以发现某些早期病害和轻微损伤。此外,尽管非成像近红外(NIR)光谱技术能检测到这些细微变化,但无法评估整个果实的品质变化。高光谱成像技术作为一项新兴技术,能够同时获取样品的光谱信息和空间信息,已成功替代传统的光谱分析和可见光图像,成为快速无损检测和分类的有效方法。研究选用‘龙薯9号’红薯作为研究对象,运用高光谱成像技术来识别缺陷红薯,并应用偏*小二乘判别分析(PLS-DA)与线性判别分析(LDA)构建分类模型,为红薯的存储与加工提供理论支持,提升红薯行业的经济效益。
实验设计
1.1.材料与方法
(1)实验材料
红薯品种为“龙薯9号”,于2019年1月购自山东省泰安市“新绿蔬菜批发市场”,选取健康红薯140个、**红薯140个、病红薯140个,共420份红薯样品进行试验。如图1所示为三种红薯。患病红薯又可分为裂纹、表皮损伤和表面**三种类型。红薯上的裂纹可能是由于收获时土壤养分不足或水分过多造成的。表皮损伤可能是由采收时的机械损伤或运输过程中红薯之间的碰撞导致,进而发展成病区。而表面**是由基因决定的,不会影响其内在的食用品质,但其外观不理想会降低红薯的经济价值。试验选用的红薯样品在重量和大小上是均匀的。用清水清洗后,在中国山东省泰安市山东农业大学采后工程实验室20℃的黑暗环境中放置24 h。
图1. 三种类型的红薯样本:(A) 健康红薯,(B) **红薯,(C) 患病红薯
(2)高光谱成像系统
本实验使用“GaiaField”高光谱成像系统(GaiaField-V10E,江苏双利合谱光谱成像技术有限公司)采集样品信息。如图2所示,该系统主要包括高光谱成像仪、成像镜头、照明系统、标准白板、三脚架和一台装有SpecView软件的计算机。高光谱系统的波长范围为400 - 1000 nm,光谱分辨率为2.8 nm,入射狭缝宽度为30 μm,相机分辨率为1392 × 1040 dpi。高光谱系统采用推扫成像技术。
图2. 高光谱成像系统
(3)高光谱数据的收集和校准
为了获得清晰、不失真的图像,将红薯样品置于低反射率黑板上,采用高光谱成像系统扫描,曝光时间为11.58 ms,镜头与样品之间的距离为47.62 mm。由于光源的不均匀性、光敏元件本身的响应差异、暗电流和偏置等因素的影响,高光谱图像的输出强度可能不均匀,不利于后续图像处理中目标特征的提取和测量。因此,有必要对高光谱图像进行黑白标定。将白板放置在采集区域,扫描得到白帧数据,关闭镜头盖将全黑图像记录为暗背景。用暗背景校准光源强度不均匀的影响,用白帧数据校准相机噪声的影响。
(4)数据处理和建模方法
将整个红薯样本作为感兴趣区域(ROI),使用ENVI 4.6软件提取并计算每个ROI中所有像素的平均光谱。由于对每个红薯样品的正面和背面进行了成像,因此共获得840幅光谱图像。在对原始光谱进行标准正态变量(SNV)预处理后,采用基于联合x - y距离(SPXY)算法按照3:1的比例划分为训练集和预测集。
在使用全光谱进行建模时,高光谱图像中的高维数据会受到某些波长间相关性和冗余性的影响,这会增加计算量和建模难度。噪声和无用信息也会影响模型的准确性和鲁棒性,不利于研究和实际应用。因此,本研究采用蒙特卡罗无信息变量消除法(MCUVE)、随机森林(RF)和逐次投影法(SPA)三种波长选择方法。采用偏*小二乘判别分析(PLS-DA)和线性判别分析(LDA)两种分类器建立了缺陷红薯的分类模型。在PLSDA模型中,将健康红薯、**红薯和患病红薯分别赋值为1、2和3的虚拟变量。以1.5和2.5作为判别阈值,如果模型预测值小于阈值T1 = 1.5,则判定为健康样本。如果大于阈值T1 = 1.5且小于T2 = 2.5,则判定为**样本。如果大于阈值T2 = 2.5,则判定为**样本。
5.2.结果与讨论
(1)光谱特征分析与预处理
图3为三种红薯样品的原始光谱、SNV预处理光谱和平均光谱。从图3可以看出,SNV预处理后的光谱纵向聚集程度有所提高,有助于消除平移误差。在420 nm附近有较强的反射率下降,这是类胡萝卜素的吸收区。光谱吸收波长在980 nm左右,属于水中O-H的二级吸收波段,由于红薯含水量高,存在较大的吸收峰。健康红薯与患病红薯在600 ~ 1000 nm范围内差异显著。**红薯与健康红薯在650 ~ 850 nm范围内差异明显,**红薯与患病红薯差异不大。这些光谱信息的变化是区分健康红薯和缺陷红薯的有力证据。
图3. 红薯光谱曲线:(A) 原始光谱,(B) SNV预处理后的光谱,(C) 平均光谱
(2)特征波长提取
分别采用MCUVE、RF和SPA提取特征波长,用于后续分类模型。提取的特征波长分布如图4所示。MCUVE、RF和SPA分别提取了11、10和10个特征波长。所有特征波长列于表1。
图4. 通过(A) MCUVE,(B) RF和(C) SPA算法提取特征波长
(3)基于PLS-DA和LDA模型的分类结果
基于MCUVE、RF和SPA方法提取的特征波长建立PLS-DA和LDA模型。PLS-DA模型预测结果的散点图如图5所示,使用MCUVE、RF和SPA提取的特征波长建立模型均获得了满意的结果。如图6所示,RF-PLS-DA模型对健康、**和病变样本的分类准确率分别为97.14%、94.29%和87.14%,总分类准确率为92.86%。大多数误判都发生在病害红薯上,这些红薯被误认为是**的红薯。
图5. PLS-DA模型的训练和预测结果:(A) MCUVE-PLS-DA模型,(B) RF-PLS-DA模型,(C) SPA-PLS-DA模型
图6. PLS-DA模型混淆矩阵:(A) MCUVE-PLS-DA模型,(B) RF-PLS-DA模型,(C) SPA-PLS-DA模型
LDA分类模型预测结果的二维和三维散点图(图7)。由于二维散点图中样本重叠,无法直观显示三种红薯样本的分类效果。因此创建了三维散点图(图8)。从图8可以看出,MCUVE-LDA模型对三种红薯样品的分离仍然不清楚,表明性能较差,且病害与**样品重叠严重。与MCUVE-LDA模型相比,RF-LDA和SPA-LDA模型具有更好的样本分类性能,三种类型的红薯样本聚类显著。为了进一步分析,生成LDA模型的混淆矩阵,如图9所示。由图9可以看出,MCUVE-LDA模型将部分患病红薯样本误判为**红薯样本,患病红薯的分类准确率较低,为90%,总准确率为96.19%。RF-LDA模型和SPA-LDA模型几乎没有误判,总分类准确率均达到99.52%。考虑到SPA-LDA模型训练集100%的总分类准确率高于RF-LDA模型训练集98.73%的总分类准确率,因此,SPA-LDA是*优的分类模型。
图7. LDA模型二维散点图:(A) MCUVE-LDA模型,(B) RF-LDA模型,(C) SPA-LDA模型
图8. LDA模型三维散点图:(A) MCUVE-LDA模型,(B) RF-LDA模型,(C) SPA-LDA模型
图9. LDA模型的混淆矩阵:(A) MCUVE-LDA模型,(B) RF-LDA模型,(C) SPA-LDA模型
结论
红薯缺陷的准确评价是红薯自动分类分级系统的关键。在这项研究中,使用了高光谱成像技术来捕捉140个健康红薯、140个**红薯和140个病害红薯的高光谱图像。采用标准正态变量(SNV)变换对原始光谱数据进行预处理,消除了大部分随机误差,使模型获得较高的精度。为了降低样品光谱信息的维数,利用MCUVE、RF和SPA分别提取了11、10和10个特征波长。然后,利用选择的特征波长建立PLS-DA和LDA模型,对健康红薯和缺陷红薯进行分类。其中RF-LDA和SPA-LDA模型对预测集的总分类准确率达到99.52%。考虑到SPA-LDA模型训练集100%的总分类准确率高于RF-LDA模型训练集98.73%的总分类准确率,SPA-LDA是*优的分类模型。结果表明,所建立的模型能够有效地识别**红薯、患病红薯和健康红薯。本研究为高光谱成像技术在红薯贮藏加工监测中的应用提供了理论依据和技术支持。
推荐产品
“GaiaField”高光谱成像系统(GaiaField-V10E)
作者简介
玄冠涛,山东农业大学机械与电子工程学院,硕导
参考文献
论文引用自三区文章:Yuanyuan Shao, Yi Liu, Guantao Xuan, Yukang Shi, Quankai Li, Zhichao Hu, Detection and analysis of sweet potato defects based on hyperspectral imaging technology, Infrared Physics & Technology, Volume 127, 2022, 104403, ISSN 1350-4495, https://doi.org/10.1016/j.infrared.2022.104403.