基于連續小波變換與高光譜成像技術的霉變花生精準識別研究(上)

      

應用方向:

本研究結合高光譜成像技術和連續小波變換(CWT),聚焦于霉變花生的精準識別,通過提取光譜敏感特征區分健康與霉變樣本。這一方法展示了高光譜技術在食品質量與**檢測中的重要應用價值,尤其在霉變與**感染監測、農產品自動分選和在線監控等方面具有廣泛潛力。相比傳統檢測方法,高光譜技術實現了非接觸、快速、綠色環保的檢測方式,為食品**監管及智能農業提供了高效解決方案。

背景:

花生作為全球廣泛種植和消費的重要油料作物,具有很高的營養價值。然而,由于其特殊的組成成分,花生極易受到**(如黃曲霉)的感染,進而產生強致癌性的黃曲霉**(AFB1)。這種**不僅對人類和牲畜健康構成嚴重威脅,還可能導致農民、加工商及分銷商的經濟損失。
現有的黃曲霉**檢測方法(如薄層色譜、高效液相色譜等)盡管準確,但存在耗時、操作復雜、依賴專業人員等局限性,不適用于自動化檢測場景。而近紅外光譜及高光譜成像技術因其非接觸性及高效性,逐漸成為食品質量評估領域的重要工具。然而,高光譜成像數據的高維特性給實時檢測系統帶來了計算負擔,特征降維成為后續數據處理的必要步驟。
連續小波變換(CWT)作為一種有效的特征提取方法,可在不同波長和尺度上分解光譜數據,從而識別出細微的光譜特征。盡管CWT在某些領域已顯示出其優越性,但其在谷物和油料作物**感染檢測中的應用仍較少。本研究旨在結合CWT和高光譜成像技術,開發一種高效、可靠的霉變花生識別方法。具體的研究目標為:(1)探索霉變花生的光譜特性;(2)確定適用于霉變花生檢測的*佳CWT特征;(3)比較CWT提取的小波特征與傳統波段選擇方法的分類性能。

實驗設計

1.1材料與方法

(1)花生樣品制備
從市場上購買了三種花生品種:花育(HY)、四粒紅(SLH)和小白沙(XBS)。手工挑選出完好無損的健康花生,并將其分成兩部分:一部分妥善保存作為健康樣本,另一部分用于獲取霉變花生樣本。為了獲得霉變花生樣本,將花生放入容器中,并置于37°C的恒溫箱中,相對濕度設定在85~90%,持續10天以促進曲霉菌屬的快速繁殖。從第11天起,溫度調整至30°C,相對濕度保持不變。分別在第20天和第30天取出花生作為不同霉變階段的霉變樣本。然后,對于HY品種的花生,隨機選取8個健康、霉變20天和霉變30天的樣本,并使用黃曲霉**B1(AFB1)快速檢測試紙進行評估。對于另外兩種花生品種,每種隨機選取10個健康、霉變20天和霉變30天的樣本,并使用AFB1快速檢測試紙進行評估。AFB1快速檢測試紙*低檢測限為5 ppb。該產品采用競爭性抑制金**層析法原理。當樣本溶液中的 AFB1 濃度超過檢測限時,檢測線不會顯現顏色反應,結果判定為陽性;當樣本溶液中的 AFB1 濃度低于檢測限時,檢測線呈現紫色反應,結果判定為陰性。在實驗過程中,健康花生樣本經 AFB1 快速檢測試紙檢測,其 AFB1 含量均低于 5 ppb,據此假設所有健康花生樣本均為健康。相反,霉變花生樣本經檢測發現 AFB1 含量均超過 5 ppb,因此假設所有霉變花生均為霉變。為排除水分含量對實驗結果的干擾,健康與霉變的花生仁分別在 60°C 的干燥箱中干燥 24 小時。
對于每種花生品種,我們獲取了七張高光譜圖像(三張用于訓練,四張用于測試)。圖1展示了用于獲取這七張高光譜圖像的花生樣本(HY)的照片。前三張圖像顯示了用作訓練數據的花生樣本,**張展示了健康的花生樣本,**張展示了第20天獲得的霉變花生樣本,*后一張展示了第30天獲得的霉變花生樣本。后四張圖像展示了用作測試數據的花生樣本;其中前兩張是健康花生和第20天獲得的霉變花生的混合物,另外兩張是健康花生和第30天獲得的霉變花生的混合物。*終,共成像了547個花生樣本(HY:154個,XBS:175個,SLH:218個),包括252個健康花生樣本和295個霉變花生樣本。在這些樣本中,232個花生樣本,包括79個健康樣本和153個霉變樣本,被用作訓練數據;315個花生樣本,包括173個健康樣本和142個霉變樣本,被用作測試數據。
 
圖1.用于獲取七張高光譜圖像的花生樣本(HY)照片:頂部三張圖像用于訓練數據集,底部四張圖像用于測試數據集
(2)高光譜成像系統與圖像采集
高光譜圖像采集使用的是GaiaSorter(江蘇雙利合譜科技有限公司)設備。它由四個部分組成:一個光譜成像系統、一個照明系統、一個傳送臺和一個計算機。光譜成像系統由一個高光譜相機(Image-λ-N25E-HS)組成,其光譜范圍為920至2530納米,該相機連接到一個標準的C口變焦鏡頭(F/2, f = 22.5 mm, HSIA-OLES22)。照明系統由四個200瓦的溴鎢燈(HSIALS-T-200W)組成。傳送臺由一個樣品臺和集成的電動精密傳送臺(HSIAT500)構成。計算機安裝了SpecVIEW系統控制軟件。
花生樣本被放置在一個10厘米×10厘米的黑色托盤中以獲取高光譜圖像,如圖1所示。所獲得的圖像共有288個波段,光譜分辨率為5.6納米。此外,為了校正所采集的高光譜圖像,我們收集了一張白參考圖像,并通過完全關閉相機光圈記錄了一張黑參考圖像。
(3)高光譜圖像預處理與光譜提取
圖像采集完成后,將所得到的高光譜圖像使用黑參考圖像和白參考圖像進行校正。另外,在捕獲高光譜圖像時,隨機噪聲是不可避免的,因此在進行進一步數據處理之前需要對數據進行了濾波。在本研究中,采用了五點平滑濾波器來處理高光譜數據。 
非花生像素不僅在后續數據處理中無用,甚至可能對分析結果產生干擾,因此被標記為背景并賦予零值。為了提取緊密相連且無法通過簡單閾值分割的花生區域,采用了標記控制的水洗算法生成掩模圖像。隨后,利��該掩模圖像有效去除背景信息。在此基礎上,進一步進行了預處理操作,包括圖像裁剪以及低信噪比波段的移除。*終,篩選出波長范圍為1000-2486nm的 265個波段用于分析
在圖像空間分割上,采用了區域生長算法,其本質是將具有相似屬性的像素組合在一起。對于每個區域,指定一個種子點作為生長的起點;然后,比較周圍的像素點以確定它們是否包含在區域內。在本研究中,應用了四鄰域區域生長算法到掩模圖像上,以連接同一核區域內的像素,并為它們分配一個序列號。然后,每個花生仁都可以通過序列號輕松追蹤,這有利于實現花生分選的工業自動化。
對于健康的花生樣本,我們從每種花生的訓練圖像中隨機選取了100個像素。對于發霉的花生,首先從訓練圖像中手動選擇發霉的像素作為感興趣區域(ROI);然后,從每種花生的ROI中隨機選取50個像素。因此,共計獲得了600個花生像素樣本,其中包括300個健康花生像素和300個不同程度**感染的發霉花生像素。所選取的花生像素樣本如圖2所示。
 
圖2.選定花生像素樣本的分布情況
(4)方法
特征波長提取:
連續小波變換(CWT)是一種強大的方法,用于在不同尺度和分辨率下檢測和分析高光譜數據中的微弱信號。本質上,CWT是一種線性操作,通過使用母小波函數在不同的波長和尺度上,可以將高光譜反射光譜轉換為一系列系數。在本研究中,由于吸收特征的形狀類似于準高斯函數,因此選擇了墨西哥帽作為母小波基。為了減輕計算負擔,僅保留了二進制尺度(21, 22, 23, …, 和 27)上的小波功率;因為總波段數為267,所以大于27 = 128的尺度上的分解分量不再攜帶有意義的光譜信息。
杰弗里斯-馬圖西塔(J-M)距離是一種靈活直觀的特征可分性指數,用于衡量兩個不同類別之間的特征,并廣泛用于指導特征選擇。杰弗里斯-馬圖西塔距離(J-M距離)的范圍是0到2,它提供了兩個類別之間可分性的一般度量。J-M距離越大,意味著兩個類別之間分離的概率越高,反之亦然。在本研究中,J-M距離被用來評估不同尺度和波長下的小波系數,以進行小波特征(WF)的選擇。
為了識別發霉花生仁,需要一種特征選擇方法來識別*重要的特征,因為許多WFs由于連續分解是冗余的,因此要選擇有意義的小波特征。首先,使用Mexican Hat作為母小波,通過CWT對每個花生仁的原始高光譜反射數據進行分解,分解尺度為21、22、23,……,27。這樣,原始光譜就被轉換成了在不同波長和尺度上的一組小波系數。其次,通過計算健康和發霉花生樣本之間的J-M距離,構建了J-M距離尺度圖。*后,根據J-M距離降序排列特征,并應用一個閾值J-M距離來劃分前1%的特征。由閾值劃分的特征在J-M距離尺度圖上形成了一個分散的特征區域。理論上,所有在特征區域內的特征都是被選擇的小波特征。然而,它們攜帶了冗余的光譜信息,因為同一區域內的特征是在連續的波長位置和尺度上產生的。因此,對于每個特征區域,使用具有*大J-M距離的特征來代表該特征區域捕獲的光譜信息。
SPA是一種前向變量選擇算法,通常用于減少模型中的變量數量,提高建模的速度和效率。它從單一波長開始,然后在每次迭代中加入一個新的波長,直到達到指定的波長數量。新選擇的變量是在之前選擇的變量正交子空間上具有*大投影值的變量。因此,SPA提取的有用變量子集具有*小的共線性。*優的變量數量通過均方根誤差(RMSE)來確定。在我們的研究中,SPA被用來選擇*優的波段以與WFs進行比較。
分類模型:
我們將健康花生標記為1,發霉花生標記為2。為了評估WFs以及SPA選擇的*優波段的性能,我們使用了兩種分類模型:偏*小二乘判別分析(PLS-DA)和支持向量機(SVM)。通過計算健康花生和發霉花生的整體分類準確率來評估WFs的性能。在PLSR中,由于預測響應很少直接產生等于1和2的二元結果,而是接近1或2的結果,因此使用了1.5作為分類的閾值。此外,PLS-DA模型中理想的潛在變量數量是通過五折交叉驗證下RMSE的值來確定的。在SVM中,徑向基函數(RBF)核被用作SVM分類框架的核。在評估方法中,通過計算靈敏度、特異性和總體準確性(OA)來評估分類模型的性能。

為了更清晰地說明圖像處理步驟,圖3展示了一個流程圖。虛線框中的部分專門針對訓練數據,用于確定*佳波段和特征權重。驗證圖像則跳過此部分,直接使用與訓練圖像相同的*佳波段和特征權重。


圖3.圖像處理流程圖

1.2.結果與討論

(1)花生的光譜反射率

圖4展示了健康和霉變花生的反射光譜,這些光譜是通過計算不同類別樣本光譜的平均值得出的。在健康花生的反射光譜中可以看到六個顯著的吸收峰,分別位于大約1208納米、1472納米、1747納米、1938納米、2145納米和2329納米(用黑點標記),主要可以歸因于與花生中的水分、蛋白質和油脂成分相關的CH、NH和OH的吸收。在1000-1500納米的波長范圍內,健康和霉變花生的光譜曲線形狀明顯不同。當花**生霉變時,1118納米處的反射率降低,導致吸收峰減弱。在1365-2486納米的波長區域,霉變花生的反射值高于健康花生,這可能歸因于**污染引起的散射和吸收特性。**的侵入可以使花生仁胚乳變得多孔,這可能導致霉變花生比健康花生散射更多的光線,這種散射會導致在反射模式下吸收更少的近紅外輻射。


圖4.健康與霉變花生的光譜響應:黑點表示健康花生的吸收峰,垂直虛線表示由SPA選擇的*佳波長變量。
產品搜索
聯系方式
產品目錄
Copyright@ 2003-2025  江蘇雙利合譜科技有限公司版權所有        
 

川公網安備 51011202000202號