高光谱成像与深度学习构建三文鱼品质 “防伪墙”(上)

      


应用方向

在该研究中,高光谱成像技术(HSI)主要应用于三文鱼地理来源溯源及真实性检测。通过分析光谱和纹理数据,结合深度学习与数据融合策略,HSI成功实现了不同产地三文鱼的精准分类,并有效检测出掺假现象,为水产品真实性鉴定提供了快速、无损且高效的解决方案。此外,研究开发了一种基于HSI数据的智能云平台,实现了实时分类,展示了该技术在食品溯源中的实际应用潜力和扩展性。这些成果凸显了HSI在食品质量检测与多维数据分析领域的广泛前景。

背景

三文鱼因其富含氨基酸、蛋白质、不饱和脂肪酸等营养成分,在全球备受欢迎。然而,由于不同地区的地理环境和生长条件存在差异,不同产地的三文鱼质量和价格差异显著,这使得其地理来源成为潜在的欺诈目标。传统的三文鱼产地识别方法多依赖于对外观(形状、纹理和颜色)的人工观察,但这种方法效率低下且耗时耗力。目前,农产品溯源领域常用的方法包括稳定同位素分析、感应耦合等离子体质谱法和多元素分析,但这些方法通常存在实验复杂、成本高昂以及对样品造成不可逆损伤等问题。因此,亟需探索一种快速、准确且无损的三文鱼地理来源识别方法。

高光谱成像(HSI)是一种快速且无损的检测技术,能够结合光谱和图像数据进行样本分类,具有较高的分辨率和鲁棒性。本研究基于HSI技术结合信息融合策略与深度学习模型,旨在解决三文鱼的地理来源溯源问题,为市场稳定和食品**提供技术支持。

实验设计

1.1材料与方法

本研究中四种新鲜的三文鱼样本来自中国的刘家峡地区、法罗群岛的Bakkafrost以及成都通威三文鱼有限公司。这些三文鱼在捕获后立即被去内脏、放血并冷冻,使用无菌刀具去除头部、尾部、皮肤和骨骼进行处理。然后,每种三文鱼被切成500份,每份尺寸为40×50×15 mm,重量为40±5 g。

本研究中,三文鱼片的高光谱图像是使用江苏双利合谱科技有限公司的“Gaia”高光谱分选机获取。该系统包括一个Image-λ “Spectrum”系列高光谱相机(Image-λ-V10E-PS),两套200W的钨卤灯光源,一个电动控制的移动平台。“Gaia”高光谱分选机的光谱范围从388-1036 nm,光谱分辨率为2.8 nm,每个像素点共有256个波段。在实验过程中,每种三文鱼获得了500张高光谱图像。在采集样本之前分别获取高光谱图像的黑白帧,以便对高光谱图像进行黑白校正。使用分析软处理收集到的高光谱图像以提取ROI获取各样本平均光谱值,采用二阶统计方法从样本中提取纹理信息。

为了从光谱数据中去除噪声并防止数据失真,本实验采用了Savitzky-Golay平滑作为一种预处理方法,基于一系列实验和经验考虑,将窗口大小设置为17。在本研究中,采用了LightGBM和GBDT算法来消除冗余和无关信息以提高模型效果。然后对集成机器学习模型(随机森林、LightGBM和GBDT)、CNN-BiGRU深度学习模型、深度学习模型(MSADBO、CNN和BiGRU)三种模型结果进行对比,得出*优模型。同时,设计了一个自建的物联网云平台,以实现对不同三文鱼地理来源的实时检测。

1.2.结果

(1)不同类别三文鱼片的光谱特性

使用HSI获取了包括挪威三文鱼、法罗群岛三文鱼、淡水彩虹鳟鱼和智利三文鱼四个类别三文鱼样本的光谱。图1展示了这四种三文鱼类别的平均光谱,可以观察到这四种三文鱼类别的整体光谱趋势大致相似,但反射率值有所不同。然而,在大多数情况下,仅凭视觉是无法准确区分三文鱼类别的。因此,进行有效的波段分析以提取相关信息,用于分类模型是必要的。


图1. 四类三文鱼的平均光谱

此外,还识别出几个与不同官能团相对应的常见吸收峰。在可见光至近红外光谱范围(400-1000 nm)内,光谱显示出明显的峰值和谷值,观察到的吸收信息主要与样本中有机大分子官能团的基本振动相关(例如,C-H、N-H、O-H和S-H)。在可见光区域(400-760 nm),在450 nm左右观察到一个显著的吸收峰,归因于肌红蛋白和总色素的吸收。在650-700 nm,观察到高反射率,反映了三文鱼的红色光谱特征。在近红外区域(700-1000 nm),在760 nm出现吸收峰,对应于O-H伸缩振动的第三泛音。此外,在980 nm观察到轻微的下降,对应于O-H伸缩振动的**泛音。这些观察表明,样本中光谱反射率的变化可以归因于它们化学性质的变化。换句话说,不同品种的三文鱼由于化学性质的差异而表现出不同的反射率。总之,400-1000 nm可以表征三文鱼肉质的特性,为后续三文鱼来源的追溯提供了理论基础。

(2)特征变量贡献分析

在全波段建模计算中,LGB和GBDT模型始终产生*稳定的结果。因此,本研究仅通过LGB和GBDT模型选择重要波长进行分类。LGB和GBDT算法被用来对光谱和纹理融合模型的2133个变量进行特征选择,每个算法提取的前30个贡献*大的特征变量被分别用于分析(见图2)。对特征变量重要性的分析显示,两个模型的光谱特征变量更集中于650 nm,而纹理特征更集中于400-450 nm和700-800 nm的单波段灰度图像。特别值得注意的是,在640-670 nm的光谱区域观察到*高的贡献率。从图1可以看出,这些光谱区域主要与色素、蛋白质和水分有关,导致三文鱼片中高反射率,并突出了三文鱼的光谱特性。


图2.特征重要性分析结果:(a) LGB模型TOP30特征变量贡献;(b) GBDT模型TOP30特征变量贡献

(3)光谱建模分析

使用237个连续波段的光谱数据和传统机器学习(ML)算法建立了三文鱼溯源模型。数据预处理采用了SG平滑方法,窗口点数设置为17。利用LGB、RF、GBDT和STACK四种监督模式识别方法对三文鱼的地理来源进行了区分。预测结果如图3所示。


图3.光谱模型的模拟结果。(a)原始数据ML算法的谱模型结果;(b)原始数据深度学习算法的光谱建模结果;(c)SG平滑后ML算法的光谱建模结果;(d)SG平滑算法的谱模型结果后深度学习算法的谱模型结果

从模型结果可以看出,传统的ML模型、集成学习模型和深度学习模型在测试集上的分类准确率���现出令人满意的稳定性,结果保持在87%到93%之间。此外,经过SG平滑处理后,所有模型的准确率都有所提高,在训练集上提高了0.1%到3.2%,在测试集上提高了0.2%到4.3%。这一现象可以归因于SG平滑有效地纠正了原始光谱中的曲率和偏移。另一方面,在CNN-BiGRU模型中,改进的正弦算法注入了强大的全局探索和局部开发能力,显著提升了模型的分类性能,整体准确率比优化前提高了0.5%到4.3%。值得注意的是,在基于光谱数据的ML模型结果中,集成学习模型表现突出,以训练集95.8%和测试集93%的准确率展示了*佳的分类性能。然而,与ML模型相比,深度学习模型在基于光谱数据的分类任务中表现不佳。这是因为深度学习需要大量数据进行训练,但在处理低维数据时更容易出现过拟合。




产品搜索
联系方式
产品目录
Copyright@ 2003-2025  江苏双利合谱科技有限公司版权所有        
 

川公网安备 51011202000202号