基于高光譜圖像的密度峰值k-均值算法估算小麥植被覆蓋度

      

應用關鍵詞

植被覆蓋度;k-means算法;NDVI;植被指數;小麥

 

背景

植被覆蓋度(Fractional vegetation cover, FVC)是測量地球表面植被分布的重要參數。在評價小麥生長狀況時,準確測定小麥各生育期的FVC具有指導意義。此外,在監測小麥生物量時,需要快速提取FVC、植物含水量、葉綠素、葉黃素含量和氮含量數據。然而,本研究發現,現有的針對小麥生長不同時期和土壤條件的FVC提取方法效果各異,無法滿足小麥多時相生長監測的精度要求。因此,開發一種操作簡單、提取精度高、受環境、時間、空間等外界條件影響較小的FVC提取新方法具有重要意義。

目前,大多數研究采用像素二分法或監督分類法分離植被與非植被,提取FVC。但是,不同時間、不同條件下采集的植被和非植被的光譜反射率的變化,會使像素二分法的閾值發生很大變化,從而使得提取效果產生較大的波動。監督分類受人為因素和樣本影響較大。當測試樣本和訓練樣本之間沒有差異時,提取效果會很好。然而,當樣本之間存在時空差異時,提取的精度將顯著降低。

考慮到無監督學習算法無需人為干預,通過確定的分類標準對植被和非植被進行分類,受人為和環境因素影響較小。因此,假設無監督學習算法可以準確地提取FVC,將其應用于各種條件下收集的數據理論上應該可以達到相同的效果。k-means算法通過像素點到聚類中心的距離來劃分像素點的類型。該算法能有效減小時間和空間對提取精度的影響。然而,k-means算法對初始選擇的質心點比較敏感,不同初始質心點的聚類結果可能有很大差異。為了減小初始質心點對k-means算法結果的影響,根據植被像素與非植被像素的不同特點,增加了密度峰值計算算法。將植被像素和非植被像素的密度峰值作為k-means算法的初始質心,以減少異常結果帶來的提取誤差,提高FVC的提取精度。

基于上述問題,本研究利用高光譜相機獲取小麥的高光譜圖像數據,計算NDVINormalized difference vegetation index),并基于NDVI圖像采用DPK-meansDensity peak k-means)聚類算法和像素二分法提取FVC。本研究比較了像素二分法與DPK-means算法的精度和穩定性,并分析了基于植被指數圖像的DPK-means算法的優勢。

 

試驗設計

試驗地點位于江蘇揚州大學,包括小麥盆栽試驗和大田試驗。中國農業科學院劉升平研究員團隊利用GaiaSky-mini2-VN高光譜相機(江蘇雙利合譜)于近地面采集了干性土壤和濕性土壤的高光譜圖像,同時將其搭載在DJI M600無人機上,獲取了大范圍小麥冠層高光譜圖像。采集設備如圖1所示。

 

1 采集設備。GaiaSky-mini2-VN相機(A)、地面數據采集設備(B)、無人機數據采集設備(C)。

如圖2所示,小麥在綠光550 nm處有一個反射峰,在紅光680 nm處有一個吸收谷,在近紅外光780 ~ 900 nm處有一個連續反射峰。小麥紅波段與近紅外波段反射率有明顯差異。土壤的光譜反射率在整個波段范圍內呈緩慢上升趨勢,沒有明顯的反射峰和吸收谷。紅波段和近紅外波段可以很好地指示植被與土壤的差異,結合它們構建的植被指數可以有效地用于植被與土壤的區分。因此,本研究選取近紅外波段800 nm和紅光波段680 nm構建NDVI

 

2 小麥和土壤的典型反射率曲線

為了檢驗基于NDVI提取的小麥植被灰度圖像上植被和非植被像素的分布,本研究制作了NDVI灰度圖像的像素頻率分布圖(圖3)。從圖中可以看出,小麥植被、土壤和盆像素都近似于高斯分布,小麥植被與土壤和盆的高斯分布距離較遠。結果表明,在NDVI灰度圖像中,植被像素與非植被像素可以很好地分離。

 

3 植被指數灰度圖像的像素分布。NDVI灰度圖(A)、NDVI灰度圖像像素分布的高斯擬合(B)。

為了解決k-means算法的局部優化問題,本研究以密度峰值作為初始聚類中心點對算法進行改進。DPK-means算法流程如下所示:

(1) 對灰度圖像進行多模態高斯擬合,計算k個擬合密度峰值作為初始聚類中心進行搜索和計算。

(2) 計算數據集中每個樣本點與k個聚類中心之間的距離,并將其劃分為距離*小的聚類中心對應的類。

(3) 計算每個類別的平均值作為新的聚類中心。

(4) 重復步驟2和步驟3,直到聚類中心的位置沒有改變,然后停止迭代。

然后,本研究基于SVM監督分類結果,比較分析了兩種方法的提取效果。具體提取過程如圖4所示。本研究采取的評價指標為EF = (FSVM FVI) / FSVM,式中EFFVC提取誤差,FSVMFVI分別為基于SVMFVC以及實測FVC

 

4 小麥FVC的提取過程

 

結論

采用像素二分法和DPK-means提取FVC。兩種土壤條件下閾值的平均值,如表1所示。將像素二分的固定閾值設置為T0T1T2DPK-means算法采用高斯核函數。兩種土壤條件下像元二分法的閾值差異較大。干土的光譜反射率明顯高于濕土。濕土的NDVI值高于干土,更接近植被的NDVI值。這可能導致在潮濕土壤條件下像素二分法的固定閾值更高。兩種土壤條件下不同方法對小麥FVC的提取效果如圖5所示。

基于DPK-means算法的EF**值和RMSE的均值*低(表2),這表明DPK-means算法具有良好穩定的提取精度。在濕潤土壤條件下,T1閾值像素二分法效果*好,EF**值僅為0.034,但其RMSE值為0.061EF分布較為分散,集中使用大樣本數據難以獲得較好的提取效果。DPK-means算法EF的均值**值為0.051,僅高于T1閾值,但其RMSE值為0.032EF分布相對集中,大樣本數據集中使用時效果較好。在不考慮土壤條件的情況下,DPK-means算法的EF主要分布在-0.05 ~ 0.05之間,EF相對集中。T0T1T2閾值下的EF分布分散,EF范圍較大。對四種方法的FVC提取結果進行線性擬合,DPK-means算法的擬合精度*高,R2達到0.87(圖6)。

DPK-means算法在無人機高光譜影像中提取FVC的效果如圖7所示。平均誤差**值為0.044RMSE0.030,誤差相對集中,與地面高光譜圖像的提取誤差相似。SVMDPK-means擬合的FVCR2達到0.93。綜上所述,DPK-means算法可以有效地從無人機高光譜圖像中提取小麥的FVC,且該算法受圖像采集日期的影響較小。

綜合地面和無人機高光譜影像的FVC提取結果,與其他算法相比,DPK-means算法受土壤條件和采集日期的影響較小,誤差分布更集中,提取精度更高。相對于像素二分法,DPK-means算法具有更高的準確性和魯棒性,在不同條件下都能取得更好的結果。

1 兩種土壤條件的平均閾值

 

 

5 兩種土壤條件下小麥FVC提取效果。土壤干燥狀況(1)和濕潤狀況(2)。A12RGB圖像;B12NDVI灰度圖像;C12為干土閾值提取的灰度圖像;D12DPK-means提取的灰度圖像;E12為濕土閾值提取的灰度圖像;F12為整體閾值提取的灰度圖像;G12SVM提取的灰度圖像。

2 兩種土壤條件和不同提取方法下小麥FVC提取誤差**值

 

 

6 采用多種方法擬合小麥FVC的結果。DPK-meansA)、T0B)、T1C)、T2D)。

 

7 不同日期的無人機高光譜圖像提取結果。RGB圖像(A)、NDVI灰度圖像(B)、DPK-means提取的灰度圖像(C)、SVM提取的灰度圖像(D)。

 

作者信息

劉升平,博士,中國農業科學院農業信息研究所研究員,碩士生導師。

主要研究方向:農業智能管控技術、智慧蜂業、農產品質量**控制。

參考文獻:

Liu, D.Z., Yang, F.F., & Liu, S.P. (2021). Estimating wheat fractional vegetation cover using a density peak k-means algorithm based on hyperspectral image data. Journal of Integrative Agriculture, 20, 2880-2891.

https://doi.org/10.1016/S2095-3119(20)63556-0

產品搜索
聯系方式
產品目錄
Copyright@ 2003-2024  江蘇雙利合譜科技有限公司版權所有        
 

川公網安備 51011202000202號