基于RGB图像和全光谱HSI数据构建的ResNet-34与改进版ResNet-34模型的混淆矩阵分别展示于图3a和b及图3c和d中。矩阵对角线上的值表示正确分类的样本数和真实阳性率,而非对角线上的值则对应误分类样本数和假阴性率。
值得注意的是,当以HSI数据为输入时,改进版ResNet-34模型在所有产地(TX、NMH、DLH、ZN1和ZN2)中实现了95.63%的*高分类准确率。这一结果较传统机器学习方法(LR和SVM)提高了6.26%。这一性能提升归因于HSI数据提供的丰富空间和光谱信息。改进版ResNet-34模型中3D和2D卷积层的结合,能够有效利用光谱和空间特征图,从而*大化模型的预测准确性。
图3.在测试数据集上使用ResNet-34模型(a和b)和改进的ResNet-34模型(c和d)对五种枸杞样品进行地理来源识别的混淆矩阵
改进的ResNet-34模型在基于起源的五种不同类型的枸杞分类中显示出较高的准确性。然而,通过3D卷积运算利用全谱HSI数据增加了计算需求和复杂性。此外,深度学习模型固有的“黑箱”特征在可解释性方面提出了挑战。为了减少信息冗余并提高模型的可解释性,我们使用SHAP来识别HSI数据中对地理起源识别贡献*大的光谱带区域。SHAP值代表了每个光谱波段对模型预测能力的贡献。对枸杞地理来源分类有重要贡献的光谱波段主要从633nm延伸到1040nm。随着光谱波段的增加,该模型对枸杞地理来源的识别精度逐渐提高(图4)。实际上,在保留35%的光谱波段(n=39)的情况下,该模型的分类精度仍然保持在95.63%的高水平,与全光谱HSI数据的分类精度相当。光谱波段的减少也导致运行时间减少29.9%。该方法不仅有效地提高了处理速度,而且提高了产地识别的效率,在准确性和计算效率之间取得了平衡。
图4.利用改进的ResNet-34对不同波段子集的枸杞产地识别数据集精度进行测试
(2)枸杞的地理来源及标记物的NMR鉴定
枸杞样品的一维1H NMR提供了详细的光谱分布,通过分析峰强度和化学位移来辨别成分组成和浓度的差异,有助于识别地理来源。在δ0.8 ~ δ3.5的高场区,主要与氨基酸和有机酸有关,但差异不大。但在丙氨酸(δ1.48)和一种未知成分(δ1.51)浓度上存在显著差异,其中宁夏枸杞(TX、ZN1和ZN2)含量显著高于青海枸杞(NMH和DLH)。δ3.5~δ5.5的中低场区以各种糖类为主,δ6.0~δ10.0的低场区以芳香族化合物为主。通过比较化学位移和耦合常数与数据库中的条目,包括FooDB和HMDB,以及与先前报告的相关性,从枸杞的核磁共振光谱中确定了62个组分。
对枸杞的化学成分分析显示其含有丰富的氨基酸、有机酸、糖类、核苷和其他生物活性化合物。枸杞的氨基酸和有机酸含量特别丰富,十几种氨基酸和五种有机酸的浓度在0.1至1mg/g之间。这些成分可能提供各种健康益处,例如产生**刺激作用,增强抗氧化能力,并保持健康的代谢率。具体而言,异亮氨酸是一种支链氨基酸,已被证明可以通过影响器官、细胞和反应性物质来增强**系统,并可能上调宿主防御肽(如β-防御素)的表达,这对先天**和适应性**至关重要。甜菜碱是枸杞的一种独特标记物,已被证明可以通过增强抗氧化活性和减少炎症介质来减轻四氯化碳(CCl4)诱导的肝损伤。有机酸,包括羟基丁酸、乙酸、苹果酸和柠檬酸,对枸杞的感官特性(如味道、风味和颜色)有重要影响。枸杞是一种久负盛名的***和滋补食品,其主要成分是枸杞多糖,尤其是枸杞多糖是枸杞中*有价值的功能成分之一。*近的研究表明,LBP具有一系列的生物活性,包括眼神经保护、抗衰老特性、抗氧化作用和**调节作用。在本研究中,LBP由半乳糖、鼠李糖、α-木糖、β-木糖、α-葡萄糖和β-葡萄糖组成,其浓度差异很大,在不同地理产地的浓度范围为0.19 ~ 103.95mg/g。此外,尽管咖啡酸、肉桂酸和维生素B6等芳香化合物的浓度很低(含量超过0.1mg/g),但它们对人体健康起着至关重要的作用,包括抗氧化和**特性,以及减少焦虑和增强视觉功能。虽然不同产地的枸杞在成分上存在显著差异,但不能仅仅通过目测比较来确定其地理来源。因此,采用多元统计分析来确定每个起源的独特GI标记。
图5展示了基于枸杞NMR数据的OPLS-DA得分图和对应的火山图 ,分别针对不同产地的枸杞样品进行成对比较,并附上模型参数,包括R²X、R²Y和Q²值。图5a展示了不同中国省份枸杞样品的比较分析。其中,OPLS-DA得分图(图5a左图)显示宁夏和青海样品沿预测成分(横轴)呈现显著分离。模型的高拟合度(R²Y=0.871)和预测能力(Q² =0.833)表明该模型在区分地理来源方面的有效性。火山图(图5a右图)用于探索宁夏和青海枸杞的地理标记物(GI标记)。根据“材料与方法”部分中详细描述的筛选标准,地理标记物被筛选出来(见图5a右图)。结果表明,青海枸杞的谷氨酸(Glu)、苹果酸(MA)和脯氨酸(Pro)含量分别是宁夏样品的1.96倍、1.91倍和1.68倍。而宁夏枸杞则以二羟基丙酮(DHA)含量显著较高,其水平是青海枸杞的2.7倍。
其中,谷氨酸(Glu)以其多方面的生理作用而被广泛认可,包括抗氧化、应对胁迫以及作为内源性**剂的作用,其衍生物在癌症**中的潜力也备受关注。脯氨酸(Pro)不仅是蛋白质的重要组成部分,还显著参与细胞对渗透压和脱水胁迫的响应。此外,脯氨酸是枸杞中*丰富的游离氨基酸,既作为渗透调节剂,也作为抗氧化剂发挥作用。青海枸杞中显著较高的谷氨酸和脯氨酸浓度将增强其抗氧化和渗透调节功能
图5. 基于枸杞NMR数据的OPLS-DA评分图(左图)和相应的火山图(右图)
图5b和图5c分别展示了宁夏和青海省内不同县域枸杞样品的比较分析。OPLS-DA得分图(图5b和图5c左图)显示TX和ZN以及NMH和DLH样品在预测成分(横轴)上呈现出显著分离。模型参数表明区分地理来源的有效性:TX与ZN的R²Y=0.967,Q²=0.936,NMH与DLH的R²Y=0.966,Q²=0.936,进一步验证了模型的预测能力和可靠性。火山图(图5b右图)及统计数据揭示,ZN枸杞中包括1-甲基尿酸、胆碱、甜菜碱、咖啡酸、谷氨酸(Glu)、鸟苷、核糖内酯、苏糖醇和丝氨酸在内的多种营养成分浓度显著高于TX样品,而蔗糖、甲酸和3-甲基黄嘌呤在ZN样品中的浓度显著低于TX。丰富的营养成分及独特的香气赋予ZN枸杞更强的抗氧化活性、减少炎症介质及神经保护作用,这在以往研究中也得到了验证。NMH与DLH样品的火山图(图5c右图)分析发现了17种显著差异的成分,包括乙醛酸、苹果酸、α/β-半乳糖醛酸、异亮氨酸、1-磷酸半乳糖、异丁酸、蔗糖、α/β-木糖、鼠李糖、肉桂酸、麦芽糖、古罗糖酸内酯���麦芽三糖、精氨酸和氨基葡萄糖6-硫酸酯。其中,有13种成分在NMH枸杞中的浓度显著高于DLH样品。尤其是乙醛酸、异亮氨酸和异丁酸在NMH样品中的浓度分别是DLH样品的4.0倍、2.09倍和2.64倍。研究表明,异亮氨酸在调节先天**和适应性**中起重要作用。异丁酸作为一种短链脂肪酸,由异亮氨酸等支链氨基酸发酵产生,已被证明可缓解DSS诱导的慢性结肠炎。这种作用主要归因于其增强肠道屏障功能的能力,从而突显NMH枸杞在胃肠健康领域的潜在**优势。
宁夏中宁县因其独特的地理和气候条件,为枸杞的高品质种植提供了得天独厚的自然环境。然而,不同品种的枸杞在化学和营养成分上存在差异。OPLS-DA模型清晰地将ZN1与ZN2沿横轴分离(图5d左图),并表现出稳健的模型参数(R²Y=0.898,Q²=0.846)。通过四项筛选标准,火山图(图5d右图)中鉴定出5种显著差异成分。葡萄糖胺6-磷酸和古罗糖酸内酯在ZN1中的浓度高于ZN2,而赖氨酸、绿原酸和肉桂酸则表现出相反趋势。其中,葡萄糖胺6-磷酸作为葡萄糖胺的衍生物,在针对中度至重度膝骨关节炎患者的临床试验中,被证明能够显著缓解疼痛并改善功能活动。赖氨酸是人体必需氨基酸,无法由人体自身合成,具有广泛的健康益处,包括促进正常生长、帮助肉碱生成以及减轻焦虑。此外,赖氨酸在癌症**中的潜力也备受关注。研究表明,赖氨酸的代谢影响组蛋白短链化,这是一种表观遗传修饰,从而调控癌症**。