最新資訊
聯(lián)系我們
- 電話 : 4000-180-060
- 手機 : 158-022-89629
- 企業(yè)QQ : 3041980058
- 郵箱 : info@np17.cn
- 網(wǎng)址 : http://www.ancientvision.com.cn
- 地址 : 天津濱海新區(qū)華苑產(chǎn)業(yè)園區(qū)(環(huán)外)海泰創(chuàng)新六路2號華鼎新區(qū)一號3號樓1門10層
- 編輯 :
天津市能譜科技有限公司
時間: 2018-05-01 瀏覽量: 327 -
稻谷脂肪近紅外光譜特征篩選及檢測模型構建
摘 要 應用近紅外光譜技術對稻谷脂肪含量進行檢測。采集了90個稻谷樣本的漫反射近紅外光譜,運用Kennard-Stone法選取校正集及預測集樣本。對比研究了歸一化、一階導、二階導、一階導+歸一化等4種預處理方法對模型性能的影響,確定一階導為優(yōu)良預處理方法。運用競爭性自適應重加權采樣技術篩選出與稻谷脂肪含量檢測相關的特征波長,再用多元線性回歸對特征波長進行優(yōu)選,最終得到30個特征波長。其中最典型的特征波長為1 343、1 489和1 583 nm,反映了稻谷脂肪中大量存在的—CH和—OH基團。所建立的基于近紅外光譜分析技術的稻谷脂肪含量檢測模型具的決定系數(shù)為0.958 9,定標標準差RMSEC為0.223 6,相對偏差為5.53%。
關鍵詞 近紅外光譜;稻谷;脂肪;競爭性自適應重加權采樣;多元線性回歸
脂肪含量是評價稻谷品質(zhì)的重要指標[1]。而其傳統(tǒng)測定方法存在過程繁瑣、條件不易控制、藥品消耗大、費時費力等不足。近紅外光譜分析技術以其檢測過程簡單迅速、耗材少、無損、分析重現(xiàn)性好、成本低等優(yōu)點,在糧食、蔬果、肉制品等方面的檢測中得到了廣泛的應用[2-4]。
目前國內(nèi)外學者利用近紅外分析技術做了一些食品檢測方面的研究,BAGCHI等[5]、SUN等[6]和XIE等[7]建立了稻米中蛋白質(zhì)及淀粉含量的檢測模型。SIRISOMBOON等[8]研究了稻谷中黃曲霉素的近紅外檢測方法。張中衛(wèi)等[9]、郭中華等[10]和趙明富等[11]建立了牛奶中脂肪和蛋白質(zhì)含量的數(shù)學模型。林家永等[12]對不同品種和儲存期限的大米水分、脂肪酸值進行檢測。上述研究所建立的數(shù)學模型對食品主要營養(yǎng)成分的檢測都能取得較好的精度,檢測結果的決定系數(shù)R2大多在0.8以上,但是模型的建立思路主要集中在2個方面:(1)根據(jù)食品營養(yǎng)成分中特殊化學基團所對應的近紅外光譜特征波長建立模型,具有模型簡單,物理意義明確的優(yōu)點,但檢測結果不穩(wěn)定,精度不高;(2)利用近紅外光譜全波長建立模型,具有適應性廣,精度理想的優(yōu)點,但模型復雜,計算量較大。
本文針對模型性能與復雜度的矛盾關系,采用競爭性自適應重加權采樣(competitive adaptive reweighted sampling,CARS)[13]方法,在稻谷近紅外光譜的全波段,篩選出適量的特征波長,然后采用多元線性回歸法建立稻谷脂肪含量的檢測模型,在保證較好模型性能的前提下盡量減小計算量,為快速檢測稻谷主要營養(yǎng)成分提供新的方法。
1 材料與方法
1.1 試驗材料
試驗材料包含A4A/R326、巨風A/R257、廣占S/R166、中9A/R591、岡紅1A/R15等46個品種的稻谷,由黃岡農(nóng)科院提供,產(chǎn)自海南省。袋裝封存于陰涼處,收獲至試驗在2個月內(nèi)完成。將部分品種按質(zhì)量1∶1的比例兩兩混合,得到44個混合樣本,共計90個稻谷樣本。
1.2 試驗設備與樣本光譜采集
近紅外光譜儀:漫反射式Supnir-2720近紅外光譜儀,杭州聚光科技股份有限公司。其測定范圍為1 000~1 799 nm,光譜采樣間隔為1 nm,光譜分辨率為10 nm。為減小誤差,每個樣本掃描3次。稻谷籽粒置于樣本盤內(nèi),且裝滿、壓實,逐一掃描。
1.3 稻谷脂肪含量測定
按照GB/T 5511—2008《糧油檢驗 糧食中粗脂肪含量測定》中的索氏抽提法[14]測定稻谷的脂肪含量,取3次測定的平均值。
1.4 數(shù)據(jù)處理方法
1.4.1 樣本集劃分
運用Kennard-Stone方法[15]對90個稻谷樣本進行分組,80%為校正集,20%為驗證集,分別用于模型的建立與驗證。Kennard-Stone方法基于變量之間的歐氏距離,在樣本光譜的特征空間中均勻選取樣本,依次選取歐氏距離最遠的點,進入校正集,留下馬氏距離居中的點在驗證集之中[16]。這樣可使光譜差異較大的樣本全部進入校正集,從而在一定程度上避免了校正集樣本分布的不均勻。
1.4.2 近紅外光譜預處理
預處理能將光譜的有效信息放大,且將光譜壓縮在相同的范圍進行比較,消除了基線漂移、樣品不均勻、光散射、光程變化等對光譜的影響。選擇合適的預處理方法,對提高模型的檢測能力和精度十分重要。本文運用歸一化、一階導、二階導等預處理方法中的一種或多種的組合對稻谷近紅外光譜做預處理。然后根據(jù)不同預處理方法所建立模型的性能指標來確定最終的光譜預處理方案。
1.4.2.1 歸一化
在建立近紅外定量模型前,為了將光譜的有效信息放大,常采用歸一化來進行預處理,使光譜數(shù)據(jù)的方差為1,均值為0,將光譜數(shù)據(jù)放在相同的范圍進行比較[17]。本文運用Z-score歸一化進行預處理試驗。
1.4.2.2 一階導
導數(shù)法可消除基線偏移、背景干擾出現(xiàn)的譜線重疊,呈現(xiàn)變化明顯的波峰波谷,提供比原始光譜更清晰的光譜輪廓變化[18]。
1.4.2.3 二階導
原始光譜經(jīng)過二階導數(shù)處理后,會變得很尖銳,有利于更好的確定波峰和波谷的位置,可使各吸收峰變得更容易區(qū)分。二階導數(shù)可以消除基線的線性傾斜[19]。
1.4.3 特征波長篩選
稻谷脂肪的近紅外光譜波長點數(shù)為800個,而樣本數(shù)是90個,利用此數(shù)據(jù)進行回歸分析,共線性非常嚴重。利用CARS方法[20]對特征波長進行篩選可簡化模型,并提高模型的檢測能力。
1.4.4 建模
為了降低模型的運算量,便于后續(xù)研究中在線快速檢測系統(tǒng)的開發(fā),使用多元線性回歸方法建立基于近紅外光譜分析技術的稻谷脂肪含量檢測模型,以模型的決定系數(shù)(R2)、定標標準差(RMSEC)、相對偏差來評價模型的穩(wěn)定性、檢測能力和優(yōu)劣。當R2越趨近于1,RMSEC和相對偏差的值越趨近于0,則模型的穩(wěn)定性和檢測能力越好,在實際中的檢測越準確。同時,在建模的過程中通過顯著性指標進一步對特征波長進行優(yōu)選,使模型進一步簡化。
2 結果與分析
2.1 樣本近紅外光譜
圖1為90個稻谷樣本的近紅外光譜圖??梢?,不同樣本的近紅外光譜在總體趨勢上是一致的。但由于物質(zhì)成分含量的微小差異,不同樣本的吸光度略有不同。
圖1 90個稻谷樣本的原始近紅外光譜圖
Fig.1 Original Near-infrared spectra of ninety rice samples2.2 樣本集劃分結果
采用Kennard-Stone法選取校正集與驗證集,結果見表1。驗證集的范圍包含在校正集內(nèi),分組合理。
表1 Kennard-Stone 分組結果
Table1 Results of Kennard-Stone2.3 樣本預處理
4種預處理方法后的結果如圖2和表2所示。由表2可知,運用一階導處理后所建模型的決定系數(shù)最大、定標標準差最小,因此選用一階導為優(yōu)良的預處理方法。
圖2 經(jīng)過4種預處理后的光譜圖
Fig.2 Spectra after 4 preprocessing methods表2 不同預處理方法的比較
Table2 Comparison of different pretreatments2.4 特征波長篩選
對光譜進行預處理后,采用CARS方法對稻谷脂肪的特征波長進行多次篩選,其篩選過程如圖3所示。圖3-a為篩選過程中選出變量的變化趨勢,隨著運行次數(shù)的增加,保留的變量數(shù)越來越少,且由快到慢呈指數(shù)函數(shù)遞減。圖3-b為波長變量篩選過程中交叉驗證均方差RMSECV的變化趨勢,在1~53次采樣過程中,RMSECV呈現(xiàn)遞減趨勢,表明篩選過程中剔除了與樣本性質(zhì)無關的變量,此時對應的變量數(shù)為34,53次后開始遞增,說明篩選過程中開始剔除了與稻谷脂肪含量相關的變量,從而導致RMSECV值增大,可見在第53次時,已將無關變量全部剔除,最后保留波長數(shù)34個。圖3-c中“*”所對應的點即為RMSECV最低點,圖3-c中各線表示隨著運行次數(shù)增加各波長變量回歸系數(shù)的變化趨勢。特征波長篩選時蒙特卡羅采樣次數(shù)為100,挑選出的34個特征波長見圖4。
圖3 稻谷脂肪特征波長篩選圖
Fig.3 Key wavelengths selection of fat in rice2.5 稻谷脂肪數(shù)學模型的建立
運用多元線性回歸方法,以34個特征波長建立稻谷脂肪含量的檢測模型,將顯著性不高的特征波長剔除,優(yōu)選特征波長,最終得到30個特征波長,回歸系數(shù)及顯著性見表3。檢測模型的具體形式為:
圖4 稻谷脂肪特征波長的分布情況(o表示特征波長)
Fig.4 Distribution of key wavelengths (shown by “o”) for fat in ricey=b+∑aixi
(1)
式中:y,稻谷脂肪含量;b,回歸常數(shù)項;ai,各特征波長的回歸系數(shù);xi,特征波長的吸光值經(jīng)過一階導數(shù)處理后的數(shù)值;i=1 000, 1 001, … , 1 799,波長所對應的納米數(shù)。
表3為稻谷脂肪檢測模型的參數(shù)及其顯著性??梢?,在x1 343、x1 489和x1 583處,回歸系數(shù)的絕對值最大,說明這些特征波長對模型的影響最大,t值相對較大,說明對模型的影響較顯著。其中,1 343 nm反映了C—H基團的第二組合頻和O—H基團的伸縮振動的二級倍頻吸收帶,1 489 nm反映了O—H基團的伸縮振動的二級倍頻,1 583 nm反映了O—H基團的伸縮振動的一級倍頻吸收帶。檢測模型的決定系數(shù)R2為0.958 9,定標標準差RMSEC為0.223 6,相對偏差為5.53%,說明模型具有較好的穩(wěn)定性和準確性。
表3 稻谷脂肪檢測模型的參數(shù)及其顯著性
Table 3 Parameters and significances of fat prediction model利用上述回歸方程預測18個驗證集的脂肪含量,偏差的絕對值最大為0.716 1,最小為0.003 2,模型驗證的決定系數(shù)R2為0.825 0,校驗標準差RMSEP為0.339 8,相對偏差為8.55%,說明所建模型具有較好的檢測能力。
3 結論
本文首先采集了90個稻谷樣本的漫反射近紅外光譜,使用Kennard-Stone法選取了校正集與驗證集。然后對比了歸一化、一階導、二階導、一階導+歸一化等4種預處理方法對模型性能的影響,使用CARS法確定了與稻谷脂肪含量檢測相關的近紅外特征波長。最后利用多元線性回歸理論對特征波長進行優(yōu)選,并建立了基于近紅外光譜分析技術的稻谷脂肪含量的檢測模型。結果表明,稻谷紅外光譜的優(yōu)良預處理方法為一階導,與稻谷脂肪含量檢測相關的近紅外特征波長為30個,其中最典型的特征波長為:1 343、1 489和1 583 nm。檢測模型的決定系數(shù)R2為0.958 9,定標標準差RMSEC為0.223 6,相對偏差為5.53%。將檢測模型用于驗證集,偏差的絕對值最大為0.716 1,最小為0.003 2,模型驗證的決定系數(shù)R2為0.825 0,校驗標準差RMSEP為0.339 8,相對偏差為8.55%,說明所建模型具有較好的穩(wěn)定性和檢測能力。
參考文獻
[1] 黃麗, 柏蕓, 韓文芳, 等. 稻米質(zhì)量對食品安全的影響[J]. 中國糧油學報, 2013, 28(4): 113-117.
[2] MILICA M P, JASNA S M. Near infrared spectroscopy-advanced analytical tool in wheat breeding, trade, and processing [J]. Food and Bioprocess Technology, 2013, 6: 330-352.
[3] 陳辰, 魯曉翔, 張鵬, 等. 玫瑰香葡萄貯藏期間糖酸品質(zhì)的近紅外檢測[J]. 食品與發(fā)酵工業(yè), 2015, 41(6): 175-180.
[4] 涂斌, 陳志, 彭博, 等. 基于多源光譜特征融合技術的花生油摻偽檢測[J]. 食品與發(fā)酵工業(yè), 2014, 42(4): 169-173.
[5] BAGCHI T B, SHARMA S G, CHATTOPADHYAY K. Development of NIRS models to predict protein and amylose content of brown rice and proximate compositions of rice bran [J]. Food Chemistry, 2016, 191(1): 20-27.
[6] SUN Cheng-xiao, YU Yong-hong, DUAN Bing-wu, et al. Rapid prediction of rice quality characteristics by near-infrared reflectance spectroscopy for breeding programs [J]. Cereal Chemistry, 2014, 91(3): 270-275.
[7] XIE L H, TANG S Q, CHEN N, et al. Optimisation of near-infrared reflectance model in measuring protein and amylose content of rice flour [J]. Food Chemistry, 2014, 142: 92-100.
[8] SIRISOMBOON C D, PUTTHANG R, SIRISOMBOON P. Application of near infrared spectroscopy to detect aflatoxigenic fungal contamination in rice [J]. Food Control, 2013, 33(1): 207-214.
[9] 張中衛(wèi), 溫志渝, 曾甜玲, 等. 微型近紅外光纖光譜儀用于奶粉中蛋白質(zhì)脂肪的定量檢測研究[J]. 譜學與光譜分析, 2013, 33(7): 1 796-1 800.
[10] 郭中華, 王磊, 金靈, 等. 基于近紅外透射光譜的乳制品蛋白質(zhì)、脂肪含量檢測[J]. 光電子·激光, 2013(6): 1 163-1 168.
[11] 趙明富, 施玉佳, 羅彬彬, 等. 基于近紅外透射光譜的牛奶中脂肪和蛋白質(zhì)含量檢測[J]. 激光雜志, 2014(1): 44-45.
[12] 林家永, 范維燕, 薛雅琳, 等. 稻米儲藏品質(zhì)近紅外光譜快速判定技術及儀器研發(fā)[J]. 中國糧油學報, 2011, 26(7): 113-118.
[13] LI Hong-dong, LIANG Yi-zeng, XU Qing-song, et al. Key wavelengths screening using competitive adaptive reweighted sampling method for multivariate calibration[J]. Analytica Chimica Acta, 2009, 648(1): 77-84.
[14] GB 5009.5—2010. 食品安全國家標準: 食品中蛋白質(zhì)的測定[S].
[15] 陳鑫. 基于智能算法的近紅外光譜分析預測模型建立方法研究[D]. 無錫:江南大學, 2013.
[16] 張華秀, 李曉寧, 范偉, 等. 近紅外光譜結合CARS變量篩選方法用于液態(tài)奶中蛋白質(zhì)與脂肪含量的測定[J]. 分析測試學報, 2010, 29(5): 430-434.
[17] 王艷陽, 魏永霞. 基于Z比分數(shù)的參考作物騰發(fā)量計算方法優(yōu)選[J]. 節(jié)水灌溉, 2015, 29(3): 52-54.
[18] 宋麗華. 花生籽仁蛋白質(zhì)含量近紅外光譜模型的建立及育種應用[D]. 保定:河北農(nóng)業(yè)大學, 2011.
[19] 白雁, 余振喜, 孫素琴, 等. 近紅外漫反射光譜技術測定牛膝中蛻皮甾酮[J]. 中草藥, 2005, 36(9): 115-118.
[20] 劉星, 單楊, 李高陽. CARS結合PLS-LDA法識別奶牛飼料中土霉素的可行性研究[J]. 包裝與食品機械, 2012, 30(4): 1-4.
Establishment of a selection and detection model of fat inrice by nearinfrared spectrum characteristics
ABSTRACT Near Infrared (NIR) spectrum was used to detect fat content in rice. NIR spectra of 90 rice samples were measured. Kennard-Stone method was used to select the calibration set and prediction set samples. The effects of different pretreatment (normalize, first derivative and second derivative methods) have been compared for the accuracy of the models. The best pretreatment method is the first derivative. The competitive self-adaptive weighted sampling technology is used to screen the key wavelengths associated with sample properties. Finally, thirty key wavelengths are selected by Multiple Linear Regression further. The most typical key wavelengths are 1 343 nm, 1 489 nm and 1 583 nm which related to the groups of —CH and —OH in rice fat. The detection model of fat content of rice based on near infrared spectroscopy has higher precision with the coefficient of determination, root mean square error of calibration and relative deviation are 0.958 9, 0.223 6 and 5.53%, respectively.
Key words near infrared spectrum; rice; fat; competitive adaptive reweighted sampling; multiple linear regression
DOI:10.13995/j.cnki.11-1802/ts.014950
引用格式:李路,黃漢英,李毅,等.稻谷脂肪近紅外光譜特征篩選及檢測模型構建[J].食品與發(fā)酵工業(yè),2018,44(2):87-91.
基金項目:中央高校基本科研業(yè)務費專項(2662015PY078);湖北省重大科技創(chuàng)新計劃(2014ABC009)
收稿日期:2017-06-13,改回日期:2017-06-21