在茶叶市场上,茶叶掺假、低质量茶作为**茶、旧茶作为新茶的问题也不时出现在上。在高经济利润的推动下,市场上偶尔会发生铁观音掺假。一些非法商人在铁观音中混合了本山、毛蟹、黄金桂,他们的外观与铁观音非常相似,但在销售过程中价格相差很大。普通消费者很难区分茶叶的真实性,这严重侵犯了消费者和经营者的合法权益。在此背景下,迫切需要一种快速、无损的检测茶叶掺假的方法。
四川农业大学康志亮教授团队利用我司高光谱设备(GaiaField-V10E)及配套的荧光系统,对铁观音掺假程度的进行无损检测。作为一种新的检测方法,荧光高光谱技术为食品检测提供了独特的优势,其基本原理是当一种物质被特定波长的入射光照射时,其分子吸收光能并从基态进入激发态,然后立即去激发并发射出光。图1荧光高光谱成像系统。
图1 荧光高光谱成像系统
在这项研究中,掺假茶和纯铁观音在形状、颜色和内部成分上只有轻微差异,这增加了检测茶叶掺假的难度。掺假茶叶样本的比例符合市场上不法商人的普遍做法。至于茶叶的荧光特性,作为一种植物,茶叶中的不同物质会吸收不同波段的光,并在不同波段发出荧光。
本山被用作掺假茶,约占茶叶样品总重量的0%、10%、20%、30%、40%和50%,并与铁观音混合。图2为经过PCA后的六个等级的茶叶三维分布图。为了对茶叶进行掺假检测。本研究在实验方案中建立了纯铁观音和掺假铁观音的两级判别模型,以快速鉴别掺假与否;另一方面,建立了六级判别模型,保证了在不同程度的茶叶掺假情况下,茶叶掺假程度的快速识别。
图2 六个掺假等级茶叶的PCA分布图
首先,荧光高光谱成像系统获得475–1000 nm波段的光谱信息。图3为茶叶的平均光谱分布图。接下来,选择Savitzky–Golay(SG)、乘性散射校正(MSC)和标准正态变量(SVN)对荧光高光谱数据进行预处理。并且对预处理方法进行参数的比较。表1为不同预处理方法在SVM下的评价指标。
表1 不同预处理方法下的评价指标
Methods
|
|
Sensitivity
|
Specificity
|
Accuracy
|
Time
|
RAW
|
Calibration
|
75.86%
|
100.00%
|
95.63%
|
1.9588
|
Prediction
|
84.21%
|
100.00%
|
96.25%
|
SNV
|
Calibration
|
100.00%
|
100.00%
|
100.00%
|
2.1267
|
Prediction
|
89.47%
|
100.00%
|
97.50%
|
MSC
|
Calibration
|
100.00%
|
100.00%
|
100.00%
|
1.7759
|
Prediction
|
94.74%
|
98.36%
|
97.50%
|
SG-7
|
Calibration
|
100.00%
|
100.00%
|
100.00%
|
1.7861
|
Prediction
|
100.00%
|
100.00%
|
100.00%
|
|
|
(a)
|
(b)
|
图3 掺假茶叶的平均光谱曲线
此外,还采用了连续投影算法(SPA)、竞争自适应加权采样(CARS)、随机青蛙算法(RF)和无信息变量消除(UVE)来提取茶叶光谱信息的特征波长。
建立了二分类模型(区分纯铁观音和掺假铁观音)和六分类模型(区分纯铁观音和五个掺假等级的茶叶)。在确定模型的预处理(SG)方法后,选择特征波长对模型进行简化。在SG平滑后,应用了四种特征选择方法。SG平滑结合SPA、CARS、RF和UVE算法,将104个通道分别减少到33、11、44和46个通道。图4显示了SG-CARS之后的特征选择。SG7平滑结合四种特征波长选择方法的评价指标如表2所示。所有的特征选择方法都有助于降低数据维数。
图4 SG-CARS后的特征选择
表2 不同特征选择方法下的评价指标
SG7
|
Number
|
|
Sensitivity
|
Specificity
|
Accuracy
|
Time (s)
|
SPA
|
41
|
Calibration
|
100.00%
|
100.00%
|
100.00%
|
1.2147
|
Prediction
|
98.51%
|
100.00%
|
98.75%
|
CARS
|
11
|
Calibration
|
100.00%
|
100.00%
|
100.00%
|
1.2088
|
Prediction
|
100.00%
|
100.00%
|
100.00%
|
RF
|
44
|
Calibration
|
100.00%
|
100.00%
|
100.00%
|
1.1935
|
Prediction
|
100.00%
|
94.74%
|
100.00%
|
UVE
|
41
|
Calibration
|
100.00%
|
100.00%
|
100.00%
|
1.1829
|
Prediction
|
100.00%
|
100.00%
|
100.00%
|
在建立六分类模型过程中。首先,与两分类模型一样,将不同的预处理方法与支持向量机相结合,建立了四类判别模型。然后,为了简化模型,选择了四种特征选择方法来筛选模型的特征波长,这有利于提高模型的效果和精度。所有模型的结果如表3所示。其中,六分类模型和两分类模型的预处理方法存在差异。通过使用SNV和MSC,提高了分类模型的准确性。
特征选择后,这些模型的总体趋势大致相同。纯铁观音、10%和30%掺假茶叶的准确率几乎为100%,但掺假程度为40%的准确率不高,表明该模型可能无法准确区分铁观音的掺假水平。相比之下,在SNV之后,模型的整体准确性得到了提高。在RF之后,整体准确度提高了1.09%,仅用时0.002秒。在该分类中,纯铁观音和10%和30%的掺假茶被准确预测;模型的变化也提高了茶叶剩余掺假比例的准确性。考虑到整体影响,RF在建立分类模型方面表现出更高的效率。总之,SNV-RF-SVM是区分纯茶和掺假茶的*佳方法,其总准确率为94.27%,仅需0.00698秒。
表3 六分类模型评价指标
Preprocessing
|
Methods
|
Number
|
Class Accuracy
|
Overall Accuracy
|
|
0%
|
10%
|
20%
|
30%
|
40%
|
50%
|
Time
|
RAW
|
NO
|
104
|
100.00%
|
100.00%
|
100.00%
|
100.00%
|
59.09%
|
100.00%
|
93.18%
|
0.01396
|
SPA
|
33
|
100.00%
|
100.00%
|
78.57%
|
81.82%
|
45.45%
|
100.00%
|
84.31%
|
0.01396
|
CARS
|
19
|
100.00%
|
100.00%
|
78.57%
|
100.00%
|
36.36%
|
78.57%
|
82.25%
|
0.01296
|
RF
|
60
|
100.00%
|
100.00%
|
78.57%
|
100.00%
|
36.36%
|
78.57%
|
82.25%
|
0.01396
|
UVE
|
41
|
100.00%
|
100.00%
|
78.57%
|
100.00%
|
45.45%
|
100.00%
|
87.34%
|
0.01300
|
MSC
|
NO
|
104
|
100.00%
|
100.00%
|
92.86%
|
100.00%
|
68.18%
|
100.00%
|
93.51%
|
0.01097
|
SPA
|
34
|
100.00%
|
94.74%
|
64.29%
|
100.00%
|
54.55%
|
78.57%
|
82.03%
|
0.00801
|
CARS
|
11
|
100.00%
|
100.00%
|
71.43%
|
72.73%
|
40.91%
|
78.57%
|
77.27%
|
0.00798
|
RF
|
55
|
100.00%
|
100.00%
|
71.43%
|
100.00%
|
63.64%
|
92.86%
|
87.99%
|
0.00898
|
UVE
|
34
|
100.00%
|
100.00%
|
71.43%
|
100.00%
|
59.09%
|
85.71%
|
86.04%
|
0.00997
|
SNV
|
NO
|
104
|
100.00%
|
100.00%
|
92.86%
|
100.00%
|
68.18%
|
100.00%
|
93.51%
|
0.00798
|
SPA
|
27
|
100.00%
|
100.00%
|
85.71%
|
81.82%
|
54.55%
|
85.71%
|
84.63%
|
0.00698
|
CARS
|
14
|
100.00%
|
100.00%
|
78.57%
|
100.00%
|
45.45%
|
71.43%
|
82.58%
|
0.00499
|
RF
|
57
|
100.00%
|
100.00%
|
92.86%
|
100.00%
|
72.73%
|
100.00%
|
94.27%
|
0.00698
|
UVE
|
46
|
100.00%
|
100.00%
|
64.29%
|
100.00%
|
59.09%
|
85.71%
|
84.85%
|
0.00698
|
SG
|
NO
|
104
|
100.00%
|
100.00%
|
85.71%
|
100.00%
|
45.45%
|
100.00%
|
88.53%
|
0.00898
|
SPA
|
41
|
100.00%
|
100.00%
|
71.42%
|
72.73%
|
31.82%
|
71.43%
|
74.57%
|
0.00798
|
CARS
|
11
|
100.00%
|
100.00%
|
92.86%
|
72.73%
|
45.45%
|
100.00%
|
85.17%
|
0.00698
|
RF
|
44
|
100.00%
|
100.00%
|
78.57%
|
90.91%
|
45.45%
|
92.86%
|
84.63%
|
0.00798
|
UVE
|
41
|
100.00%
|
100.00%
|
78.57%
|
81.82%
|
36.36%
|
85.71%
|
80.41%
|
0.00898
|
**作者简介:
康志亮,四川农业大学教授,硕士生导师。
主要研究方向:信号与信息处理、传感器与检测技术、自动控制。
参考文献:Hu Y , Kang Z . The Rapid Non-Destructive Detection of Adulteration and Its Degree of Tieguanyin by Fluorescence Hyperspectral Technology[J]. Molecules, 2022, 27(4):1196. DOI:10.3390/molecules27041196