烟用爆珠是嵌在烟滤嘴中的一粒或多粒脆性胶囊,胶囊中包裹了特色香精香料及适量溶剂液体,能够延缓挥发性香味物质的自然损失,实现烟抽吸过程中特色香味物质人为可控释放。随着爆珠烟销量的增长,对烟用爆珠的研究日益增多。GC-MS法虽然能够获取烟用爆珠内含物中挥发性及半挥发性化学成分信息,结合指纹图谱能够分析烟用爆珠的质量稳定性,但其前处理及分析费时费力,对样品具有破坏性。采用近红外光谱技术法结合SIMCA可以快速判别不同类型烟用爆珠,LDA模型可将3种类型不同批次的烟用爆珠有效分开;同时,采用GC-MS法对烟用爆珠内含物中挥发性及半挥发性化学成分进行定性分析。
GC-MS分析
将烟用爆珠破碎后取内含物,采用正己烷振荡萃取内含物成分,以GC-MS方法分别对清甜型、蜜甜型和薄荷型3类烟用爆珠内含物的挥发性及半挥发性成分进行分析,通过检索NIST14标准谱库进行匹配度比对及定性分析。
NIR分析
1.光谱采集
在室温下,采集烟用爆珠样品的NIRS。爆珠放置一层,在此上方添加金属盖,用于反射近红外光。光谱采集范围:12000~4000cm-1;光谱分辨率:16cm-1;扫描次数:64次。通过样品杯旋转,一个样品扫描5~6点,获得此样品5或6张光谱。由于批次数量有限,在不同天重复采集每批次爆珠产品3次。在收集光谱数据的过程中,样品杯与金属盖在样品测试之前用无水乙醇擦拭。*终共收集416张光谱,其中,清甜型6批次92张光谱;蜜甜型14批次212张光谱;薄荷型7批次112张光谱。
2.光谱数据预处理
归一化常被用于校正由微小光程差异引起的光谱变换;均值中心化是被使用非常普遍的预处理方法;标准化特别适用于样品间差异很小的情况。MSC首先分离光谱中的物理光散射信息和化学光吸收信息,然后消除不同光谱之间的物理散射信息差异,尽量使所有样品中的光谱校正信息在同一水平上。MSC主要是为了消除颗粒分布不均及颗粒大小产生的散射影响,在固体漫反射和浆状物透射光谱中应用较多。SNV认为每张光谱中各波长点的吸光度值应满足一定的分布,如正态分布。通过该假设对每张光谱进行校正,可有效降低固体颗粒大小以及仪器状态对红外谱图的影响。通过比较光谱数据不同处理方法后建立的模型预测识别准确度,选出*优的光谱数据处理方法。
3.模式识别算法与模型性能评价指标
采用SIMCA算法对3种烟用爆珠建立类型判别模型;采用LDA算法对同一类型不同批次的爆珠质量一致性进行评价。LDA属于有监督的模式识别方法,分别计算类内和类间的协方差矩阵。对于未知类别样品光谱,需计算其与每类均值的距离平方,然后将其判定到距离*小的类型中。
计算校正模型的识别率和误判率,利用二者判断分类器的好坏。识别率是识别自身样本个数与预测样本总个数的比值;误判率是误判其它类的样本个数与其它类样本参与识别个数的比值。通常,识别率数值越大越好,误判率数值则越小越好。
其中,A为识别率,S为识别自身样本个数,TS为预测样本总个数,E为误判率,W为误判其它类的样本个数,TW为其它类样本参与识别总个数。
3种类型烟用爆珠GC/MS分析
图1为清甜型烟用爆珠内含物GC-MS总离子流图,采用NIST14标准谱库对图1中色谱峰进行匹配度比对及定性分析,结果如表1所示,共鉴定出10种化合物:醇类1种,酮类4种,酯类2种,酚类1种,醛类2种。其中,特征香味成分有乙基麦芽酚、香兰素和乙基香兰素。添加乙基麦芽酚不仅可提升香味,还起到增甜作用;香兰素俗称香草醛,具有强烈又独特的香荚兰豆香气,且香气稳定;乙基香兰素具有类似香荚兰豆香气,其香气是香兰素的3~4倍,且留香持久。
在蜜甜型烟用爆珠内含物**鉴定出17种化学成分:醇类2种,酮类1种,酯类7种,烯烃类5种,醛类1种,其它类1种。特征香味成分有己酸乙酯、2,6-二甲基-5-庚烯醛与L-薄荷醇,都可起到增香作用。薄荷型烟用爆珠内含物共鉴定出26种化学成分:醇类4种,酮类5种,酯类9种,烯烃类有7种,其它类有1种。在这些化学成分中,以L-薄荷醇的含量*高,是薄荷型爆珠主要的特征香味成分。
采用GC-MS分析3种烟用爆珠内含物的挥发性及半挥发性成分,由定性分析结果可知,3种烟用爆珠香型不同,其内含物中的挥发性及半挥发性成分、特征香味成分差别很大。
3种类型烟用爆珠近红外光谱数据分析
对3种类型烟用爆珠的不同批次27个样品的416张光谱进行分析。原始光谱数据和分别进行归一化、均值中心化、标准化、MSC、SNV预处理后的数据进行建模,每类选出20%的样品光谱(清甜型19个,蜜甜型43个,薄荷型23个)用于外部预测,对所建模型进行验证。
SIMCA分类模型
SIMCA又称相似分析法,是建立在主成分分析基础上的一种有监督模式识别方法,该算法的基本思路是对训练集中每类样本的光谱矩阵分别进行主成分分析,建立每类的主成分分析模型,在此基础上对未知样本进行类别归属。结合不同光谱预处理方法,采用SIMCA方法(5个主成分,90%置信度)分别对3种类型烟用爆珠进行建模。
表2为原始光谱数据和经5种预处理方法后的光谱数据的SIMCA建模分类效果。相对其余光谱预处理,MSC、SNV的模型分类效果显著提高,识别率均超过90%,3种类型烟用爆珠可被有效分开,同时SIMCA所建立的模型不存在误判现象;相对MSC与SNV而言,原始光谱直接建模,其分类器性能差,清甜型、蜜甜型识别率均较低,并存在误判的现象,与光谱经过MSC与SNV处理所建的分类器有明显差距;归一化、均值中心化、标准化处理后的模型效果未得到明显改善,说明这3种预处理方法并不适用于本研究体系。事实上,MSC与SNV的目的基本相同,主要是为了消除固体颗粒分布不均匀及颗粒大小产生的散射影响。二者分类器潜力基本相近,很有可能消除了散射光对光谱数据的影响。
蜜甜型爆珠壁材为黄色,清甜型、薄荷型爆珠壁材为绿色,采用近红外光谱法结合SIMCA算法可将3种类型烟用爆珠在一定程度上成功分开,说明NIRS结合数据处理可有效判别不同颜色壁材的爆珠。
用预测集对建立的SIMCA模型进行性能测试,分类结果见表3,MSC、SNV光谱数据预处理的验证效果良好,对3种类型烟用爆珠的识别率均在90%以上;MSC与SNV的结果相近,与训练集的行为基本一致,很有可能消除了散射光的影响。MSC与SNV分类器的分类结果表明,所建立的SIMCA模型具有较高的预测准确度和预测稳定性。
图2A与图2B分别为烟用爆珠未经处理和SNV处理的NIRS数据图。由图2可见,光谱SNV处理可以明显地消除基线漂移的影响。
烟用爆珠质量一致性评价
采用LDA算法(PCA联用马氏距离,选取5个主成分)对同一类型不同批次的烟用爆珠进行质量一致性评价。
表4为原始及预处理之后光谱数据LDA模型的训练集识别准确度,5种预处理方法和无预处理的光谱数据的LDA模型分类效果均很好,都基本接近100%。3种类型烟用爆珠的不同批次均能被很好地分开。不同光谱预处理的LDA模型需用外部检验的方法,以寻求*佳的分类器。所建立的各个LDA模型通过预测集进行性能测验。
表5为预测外部样本批次归属的准确度,所有LDA模型的预测准确度均很好,其中,MSC的分类结果略优,对3种类型烟用爆珠类内不同批次均能很好地分开。
采用GC/MS方法可获取3种烟用爆珠内含物的化学成分,说明3种烟用爆珠香型不同,其内含物挥发性及半挥发性成分不同,每种香型烟用爆珠中特征香味成分差异很大。近红外光谱结合SIMCA建模可快速、准确地判别不同香型的爆珠。采用GC/MS方法对3种烟用爆珠内含物成分测定结果进一步说明,NIRS能够准确判别不同香型的爆珠。
采用GC/MS方法可获取3种烟用爆珠内含物的化学成分,说明3种烟用爆珠香型不同,其内含物挥发性及半挥发性成分不同,每种香型烟用爆珠中特征香味成分差异很大。近红外光谱结合SIMCA建模可快速、准确地判别不同香型的爆珠。采用GC/MS方法对3种烟用爆珠内含物成分测定结果进一步说明,NIRS能够准确判别不同香型的爆珠。