普洱茶为国家地理标志保护产品,是以云南大叶种茶树鲜叶为原料,经杀青、揉捻、毛茶干燥,再以自然的方式陈放或经过渥堆转熟等制成具有独特品质的普洱茶生茶或熟茶。普洱茶中含有茶多酚、茶多糖、游离氨基酸、等营养活性成分,具有抗肿瘤、抗氧化、降压减脂、降血糖等功能,受到不同年龄层次消费者的青睐。普洱茶生茶和熟茶的生产工艺不同,消费者通过肉眼就很容易辨别新茶的生茶(灰绿、墨绿色为主)和熟茶(深褐色或褐红色为主)。但随着贮藏时间的延长,生茶挥发性组分逐渐发生变化,颜色也逐渐变为深褐色,普通消费者通过感官评价很难识别老生茶和熟茶。由于不同产地普洱茶的营养活性成分、风味物质等组分存在差异,普洱茶的价格差距很大,这就为不法商家谋取利益提供了可能。因此,迫切需要建立科学精准的方法,对普洱茶生熟属性和产地进行溯源鉴别。
目前,已有学者利用化学成分分析和近红外光谱技术(NIRS)实现了普洱茶生熟茶的有效识别。这些前期研究中的样品直接来自普洱茶厂家,虽然保证了样品来源的真实性,但与市场上销售的普洱茶可能存在差异。因为市场茶叶经过运输、仓储的过程,使得普洱茶的组分发生了变化。消费者实际接触到的普洱茶产品与在厂家直接获得的普洱茶,尤其是生茶,在风味上会有一定差异。由于化学成分分析方法一般较繁琐,不能满足市场快速识别的需求,因此,借助NIRS对市场上普洱茶进行生熟茶的识别可能更具有实际意义。
近红外光谱主要反映食品各组分中含氢基团振动的倍频和合频,具有快速、无损、绿色等优点,已经在普洱茶发酵程度判别、多糖含量预测、真假识别及其他茶类的产地溯源上广泛应用。因此,本研究以普洱茶主产区普洱市、西双版纳傣族自治州和昆明市的普洱茶生茶和熟茶为对象,应用NIRS结合化学计量学方法,开展普洱茶生茶和熟茶的判别及不同产地普洱茶的溯源,以期为普洱茶的真实性判定和市场监管提供技术支持和基础数据。
普洱茶生茶和熟茶判别
在近红外谱图的10000—9000cm-1波数处可以清楚地区分大部分普洱茶生茶和熟茶,但在9000—4000cm-1波数,熟茶与生茶出峰位置一致,谱图重叠,难以辨别生熟茶,且存在2个普洱茶熟茶谱图在10000—9000cm-1波数处与生茶谱图重叠,需要借助化学计量学方法进行不同产地生熟茶的识别。
如图2所示,在PCA中,取普洱茶生茶和熟茶前两个主成分时,对原变量解释能力(R2X)累积为0.968,大部分普洱茶生茶和熟茶可以明显区分开,且由于贮存年份对生茶的化学组分影响较大,生茶较熟茶更分散。但是有2个生茶与熟茶相聚集,有2个熟茶的位置与生茶更接近,甚至有1个生茶与熟茶近似重叠(箭头所指),证明老生茶化学组分中所含氢基团综合与熟茶差异并不明显,普通消费者通过感官很难识别老生茶和熟茶,也说明了通过PCA难以实现所有生熟茶的识别。因此,需要运用有监督学习算法PLS-DA来提高生熟茶的识别正确率。
普洱茶生熟茶PLS-DA模型的主成分数、主成分数对原变量的解释能力(R2X)和生熟茶识别正确率见表1。**个主成分对原变量的解释能力为0.714,对普洱茶生熟茶的识别正确率为81.82%,有8个生茶被错判为熟茶,2个熟茶被错判为生茶,说明**个主成分包含原变量信息*多,且有些老生茶所含氢基团可能与熟茶更相近。当取前两个主成分数时,对原变量的解释能力为0.964,模型对生熟茶的识别正确率为90.91%,有3个生茶被错判为熟茶,2个熟茶被错判为生茶(图3)。PLS-DA模型的前两个主成分得分图与PCA前两个主成分得分图(图2)相似,但PLS-DA可以更好地将组间差异不明显的变量加以区分,图2中箭头所指相互重叠的生熟茶样品,在图3中则被很好地区分(圆形部分)。当主成分数增加到3时,R2X累积增加到0.994,此时,模型对生熟茶的识别正确率为94.55%,有2个生茶被错判为熟茶,1个熟茶被错判为生茶。当主成分数增加到4,R2X累积增加到0.995,模型识别正确率为96.36%,熟茶的识别正确率为100%,仍然有2个生茶被错判为熟茶,可能增加的主成分中包含更多的熟茶特征成分。当主成分数由4增加到10时,R2X累积逐渐增加,*终增加到1,但是模型对生熟茶的识别正确率没有发生变化,均为96.36%。当主成分数由10增加到13时,R2X累积和模型识别正确率均无变化。当主成分数增加到14,R2X累积为1,模型识别正确率为98.18%,只有1个生茶被错判为熟茶,说明所增加的主成分含有更多与生茶特征成分相关的信息。当主成分数增加到15时,模型对生熟茶的正确识别率达100%,说明利用有监督学习算法PLS-DA可以将普洱茶生熟茶完全识别。
不同产地普洱茶产地溯源
由于不同产地普洱茶光谱的主要峰形相似,谱图存在重叠现象,普洱茶的原光谱(图1)并不能直接识别普洱茶的产地,可以运用PCA和PLS-DA来辅助实现。
由图4a知,其一个主成分对原变量的解释能力为0.818,说明**个主成分包含原变量的信息*多,前两个主成分对原变量的解释能力累积为0.977,说明前两个主成分已包含了样品的大部分信息。虽然图4a中生熟茶分别聚集,但是3个产地的普洱茶分散无规律。再将生熟茶分开考察不同产地的溯源情况,由图4b和4c可知,3个产地的普洱茶也不能被正确溯源。结果表明:不同产地自然环境、种植方式等对普洱茶的影响在光谱中的综合反映没有生熟茶中化学组分的影响大,仅通过无监督学习算法PCA的前两个主成分并不能实现3个产地普洱茶的溯源。
使用有监督学习算法PLS-DA进行普洱茶不同产地的溯源。不同产地普洱茶的PLS-DA主成分数、主成分数对原变量的解释能力(R2X)和模型产地溯源正确率见表2,其前两个主成分得分见图5。PLS-DA的其一个主成分R2X为0.787,模型的溯源正确率仅为47.5%,因此,需要继续增加建模的主成分数。当取前两个主成分时,对原始变量解释能力的累积为0.976,但是溯源模型的正确率反而降低为42.5%,说明其二个主成分可能包含了产地溯源不相关的信息,且图5可以进一步说明不同产地的普洱茶混合分散,并没有呈现聚集现象,这与PCA的前两个主成分得分图(图4a)相似。当主成分数继续增加,对原始变量解释能力的累积逐渐增加,模型溯源的正确率也在缓慢增加。当主成分数取6时,R2X累积达到约1,但是模型的溯源正确率仅为62.5%,这可能与不同产地普洱茶的含氢基团综合差异小有关,且光谱数据的原变量数为6224个,即使主成分数大幅度增加,但其所包含的与产地相关的信息增加量却缓慢增加。*终当取前26个主成分数时,模型的溯源正确率达到100%,虽然主成分数较多,但这是与光谱原始变量数相对应的,证实了PLS-DA可以实现不同产地普洱茶的溯源。
未知类别的普洱茶生熟茶预测和未知产地的普洱茶产地溯源
对于所建模型的预测能力和稳健性,通过市场所采集的未知样品进行验证。从图6可见,PCA和PLS-DA前两个主成分得分图中均将10个未知类别普洱茶中的1个判为生茶,其他9个判为熟茶,且表3也证实了当PLS-DA模型的识别正确率为100%时,10个未知类别普洱茶中有1个为生茶,9个为熟茶。以上结果表明,在判别普洱茶类别时,PCA和PLS-DA模型均表现出优良的预测能力和稳健性,可以将模型用于普洱茶生熟茶的识别。
由图7可知,由于已知产地普洱茶的PCA和PLS-DA前两个主成分得分图不能很好地将三地普洱茶进行溯源,且未知产地的样品也与3个地区已知的样品混杂,因此,利用PCA和PLS-DA的前两个主成分得分图不能实现未知样品的溯源。由表2可知,当PLS-DA的主成分数增加到26时,已知样品的溯源正确率为100%,此时,PLS-DA模型对25个未知样品的溯源结果为5个样品来自西双版纳,13个样品来自普洱,7个样品来自昆明(表4),说明可以利用PLS-DA模型来实现普洱茶未知样品的产地溯源。
基于普洱茶因生产工艺、产地等造成的其化学组分中含氢基团综合存在差异,利用NIRS结合无监督学习算法PCA和有监督学习算法PLS-DA进行普洱茶(老)生熟茶类别识别及普洱茶产地的溯源。结果表明:PCA和PLS-DA模型均可很好地实现普洱茶生熟茶识别,且PLS-DA*优模型的识别正确率可达100%;但PCA模型不能实现三地普洱茶的溯源,而PLS-DA*优模型的溯源正确率为100%,说明PLS-DA模型可以实现西双版纳、普洱和昆明三地普洱茶的溯源。
近红外光谱技术可以替代那些传统的费时费力的湿化学检测和色谱检测。 傅立叶近红外具有无损,不需要制备样品和无需使用危险化学品的特点,可以快速准确地用于定量和定性分析。
布鲁克的近红外产品线包括实验室离线应用的TANGO、MPA II以及过程控制应用的的MATRIX-F。