大米是我国主要的粮食作物之一。随着社会经济的发展,大米的质量问题逐渐引起了人们的关注。其中,大米的陈化和掺假是一个突出的问题。传统的大米鉴别方法主要依赖于人工经验和化学分析技术,普遍存在分析周期长、操作复杂、成本高等问题。因此,需继续探索更加准确、快速、稳定的大米鉴别方法。
与传统分析技术相比,近红外光谱分析技术具有诸多优点,它能在几分钟内,仅通过对被测样品完成一次近红外光谱的采集测量,即可完成其多项性能指标的测定(*多可达十余项指标)。光谱测量时不需要对分析样品进行前处理;分析过程中不消耗其它材料或破坏样品;分析重现性好、成本低。
因此,在建立大米检测模型时,可以基于近红外光谱数据的基础上采用北方苍鹰优化算法(Northern Goshawk Optimization,NGO)以及对核极限学习机(Kernel Extreme Learning Machine,KELM)的两个重要参数进行寻优并建立模型。
材料与方法
1、材料
实验样品为2017年和2022年水稻成熟后,于黑龙江省建三江市七星农场采用五点式随机采样法获取的五优稻4号,将其脱粒碾磨至精白米后作为研究样品。其中新大米样品为2022年收获大米,掺假大米样品为将2017年收获的大米按照不同比例(25%、50%、75%)掺入2022年收获的大米中,陈化大米样品为2017年收获大米。采用高精度电子秤取(5±0.02)g作为一份样品,共计新大米30份样品、掺假大米90份样品、陈化大米30份样品。
2、仪器与设备
TANGO近红外光谱仪,德国布鲁克(北京)科技有限公司。
3、实验方法
3.1光谱预处理
对原始光谱数据进行标准正态变量变换(Standard Normal Variate,SNV)预处理,用于消除颗粒不均等原因产生的噪声信息,原理为样品光谱数据各波数点的吸光度符合一定分布,计算时将每个样品的原始光谱减去理想光谱,再除以标准差。SNV公式
3.2 基于NGO-KELM的陈化大米定性鉴别方法
分别建立KELM分类模型和NGO优化后的KELM分类模型。将新鲜大米30份、掺假大米90份以及陈化大米30份共计150份样本数据随机按照7∶3的比例分为训练集(105份)和测试集(45份)。采用训练集和测试集的预测准确度和F1值作为模型的性能评价指标,并绘制混淆矩阵。
3.3基于NGO-KELM的陈化大米掺假定量分析方法
基于上文定性分析,分别建立KELM回归模型与NGO优化后的KELM回归模型,对掺假样品进行掺假量的定性分析,探讨KELM模型和NGOKELM模型对新鲜大米中掺杂陈化大米量的预测能力。将新鲜大米30份(掺假量0%)、掺假大米90份(掺假量25%、50%、75%)、陈化大米30份(掺假量100%)共计150份样本按照7∶3的比例随机分为训练集(105份)和测试集(45份)。对于定量预测模型采用决定系数R2和RMSE作为性能评价指标,并绘制柱状图来反映预测结果。
结果与分析
1、定性实验结果分析
分别建立KELM模型和NGO-KELM模型,对比二者准确度和F1值并绘制混淆矩阵从而确定模型的性能,实验结果见表1。NGO-KELM模型的训练集和测试集准确度与F1值均高于未优化的KELM模型(NGO-KELM测试集的混淆矩阵见图1),其测试集准确度提高约5%,说明NGO能有效提高KELM模型的分类准确度。
图1 NGO-KELM模型在测试集上的混淆矩阵表1 各模型结果对比
2、定量实验结果分析
分别建立KELM模型和NGO-KELM模型进行实验发现,利用NGO优化的KELM模型的定量预测表现也有显著的提升,结果见图2。
图2 各模型定量预测结果对比
NGO-KELM模型测试集决定系数R2和RMSE分别提升了0.0541和0.0233,得到了较理想的掺假率检测精度,见表2,该方法显著优于传统方法。
表2 各模型定量预测结果
3、结论
基于NGO-KELM实现了陈化大米的定性鉴别和掺假定量分析。通过近红外光谱设备采集标准样品的信息,并采用NGO优化算法对KELM模型进行了优化。建立的模型具有较高的准确度和稳定性,可以有效鉴别陈化大米,同时能对其掺假进行定量分析,为陈化大米的定性鉴别和掺假定量分析提供了一种新的分析方法。