雞蛋粉產品包括全蛋粉、蛋黃粉、蛋清粉等。蛋清粉的蛋白質量分數(shù)可高達80%,同時具有低脂肪低碳水的特點,特別適合生長發(fā)育期、老年人、術前術后、肥胖者或者是運動人群食用。目前,在蛋粉生產過程中部分企業(yè)摻入廉價的植物蛋白粉或者面粉等,以次充好,不但擾亂了蛋粉市場的秩序,也給食品安全帶來了極大隱患。相較于全蛋粉和蛋黃粉,蛋清粉蛋白質含量較高,市面上價格較貴,其摻雜情況更加嚴重。
近紅外光譜是一種快速、無損、綠色的檢測技術,其原理為通過物質在近紅外波段的吸收與散射特性,獲取有機物中含氫基團(如C—H、N—H、O—H)的信息。該檢測方法已經廣泛應用于粉末狀食品的真實性檢測中,如淀粉、花生粉、辣椒粉等。
近年來,一維卷積神經網絡(1D-CNN)在多維數(shù)據上展現(xiàn)了強大的數(shù)據特征提取能力,在回歸預測、定性檢測等各個場景應用中獲得了較大的成功。針對近紅外光譜數(shù)據處理,該方法已運用于食品分類、含量預測、作物成分檢測等場景中,并取得了良好的效果。基于此,本研究擬應用1D-CNN模型,并基于近紅外光譜數(shù)據對蛋清粉進行真實性檢測。
針對蛋清粉全近紅外光譜信息復雜、原數(shù)據存在較多噪聲、低濃度摻雜難以檢測等問題,華中農業(yè)大學工學院的祝志慧、李沃霖、韓雨彤等在主干網絡加入有效通道注意力模塊(ECA),提高模型對特征的敏感度,減少近紅外光譜噪聲及無用波段對蛋清粉鑒別的干擾。同時,運用一維全局平均池化(1D-GAP)技術,替代原1D-CNN結構中的全連接層,在實現(xiàn)有效提取光譜整體特征、減少模型過擬合的同時,降低模型的計算量,更好地將模型部署在嵌入式設備上。該模型可實現(xiàn)基于全近紅外光譜數(shù)據,對蛋清粉的真?zhèn)芜M行快速、準確的鑒別,以期為開發(fā)針對蛋粉質量檢測的便攜式近紅外光譜檢測儀提供一定的理論基礎。
1 原始光譜數(shù)據分析
1.1 純蛋清粉與摻雜蛋清粉光譜分析
從圖4a可知,不同產地蛋清粉光譜圖的變化趨勢十分相似,波峰、波谷位置相同。由圖4b可知,純蛋清粉與摻雜蛋清粉的原始光譜圖的變化趨勢,波峰、波谷位置也十分相似,吸光度隨著波數(shù)的增加而逐漸減小。純蛋清粉與摻雜蛋清粉的光譜高度重疊,無法僅通過光譜圖進行鑒別,需要通過相應的鑒別模型提取有效信息,實現(xiàn)對樣本快速、準確的鑒別。
1.2 不同摻雜種類蛋清粉光譜分析
5 種摻雜物與純蛋清粉的原光譜圖對比如圖5a所示。淀粉與大豆分離蛋白兩種增量劑摻雜物在4 200~4 850 cm-1與6 400~7 100 cm-1范圍內吸光度區(qū)分明顯;三聚氰胺和尿素兩種含氮類化合物相比于增量劑,光譜區(qū)分度更大,在4 250~5 150、5 400~7 100 cm-1范圍內吸光度大小區(qū)分明顯;對于甘氨酸,在4 950~7 200 cm-1范圍內吸光度變化趨勢有很大的差異。圖5b~d分別為單組分、二組分摻雜和三組分摻雜與純蛋清粉的光譜圖,紅框標出的光譜變化區(qū)間分別對應著各類摻雜物質的光譜變化特征。通過對比可以得出以下結論:1)摻雜物的種類及濃度決定了光譜圖變化的區(qū)間及程度,其光譜圖變化直觀表現(xiàn)了摻雜樣本的種類及濃度特征,也直觀表現(xiàn)了摻雜樣本與純蛋清粉樣本的特征差異;2)摻雜物濃度決定了光譜特征區(qū)間的畸變程度,摻雜濃度越大,光譜畸變越明顯,低摻雜濃度的光譜畸變輕微,無法通過肉眼觀察光譜圖判斷;3)多種摻雜物混合摻雜會導致光譜圖多處區(qū)間發(fā)生變化,且二組分和三組分摻雜變化的區(qū)間及程度為混合摻雜中每一種摻雜物質單獨摻雜時各自產生光譜變化特征的疊加;4)由于摻雜物所含的成分與蛋清粉不同,摻雜導致蛋清粉樣本的主要成分(C—H鍵、N—H鍵和O—H鍵)發(fā)生了變化,進而產生光譜畸變,以上波段的變化說明這些波段存在著C—H鍵、N—H鍵和O—H鍵倍頻和合頻的吸收峰,這些官能團與蛋清粉的蛋白質、水分等物質有緊密的聯(lián)系,其中4 339 cm-1和5 851 cm-1對應的是C—H鍵的合頻和一倍頻,4 447 cm-1對應的是N—H鍵的合頻,4 979 cm-1和6 869 cm-1分別對應O—H鍵的合頻和一倍頻。真實性檢測模型的本質是準確學習有效光譜特征,對光譜數(shù)據按照學習的特征進行分類,這些結論為之后模型的訓練及檢測結果提供了理論依據。
2 模型消融實驗結果
為研究改進方法對模型的優(yōu)化效果,需進行消融實驗。模型設定批大小(batch_size)為256,迭代次數(shù)(Epochs)為3 000 次,按照1.3.3節(jié)劃分的訓練集與驗證集作為輸入,對模型進行訓練,按照1.3.3節(jié)劃分的測試集作為輸入進行模型的測試,其中訓練集、驗證集和測試集的光譜數(shù)據不經過預處理,直接進行相應的模型訓練及測試。模型的評價指標按照1.4.3節(jié)進行計算,最終結果如表1所示。
從表1可以看出,經過ECA模塊的優(yōu)化,模型對于處理近紅外光譜中蛋清粉真?zhèn)翁卣鞯哪芰Φ玫搅嗽鰪姡缒P虴CA-1D-CNN相比于原1D-CNN模型,F(xiàn)FPR下降了0.3 個百分點,F(xiàn)FNR降低了1.78 個百分點,AAR提升了1.03 個百分點。且引入了1D-GAP的模型,在檢測速度指標上均得到了一定的提升,如模型GAP-1DCNN相比于1D-CNN模型和ECA-1D-CNN模型,其平均檢測時間分別減少了0.000 2、0.000 3 s,模型大小減少了0.79、0.80 M,F(xiàn)LOPs減少了0.13、0.14 M。兩種優(yōu)化方法共同使用的模型效果最優(yōu),EG-1D-CNN相比于ECA-1D-CNN模型,總準確率得到了提升,模型大小減少了約39.8%。與GAP-1D-CNN模型相比,模型大小和FLOPs雖有所增高,但FFPR減少至0,總準確率提升了0.57 個百分點。
綜上所述,運用了ECA與1D-GAP模塊的EG-1DCNN模型,在準確度、檢測速度及模型大小上相比原模型均有所提升,這說明ECA模型可增強對全近紅外光譜數(shù)據的特征提取能力,進而提升了對蛋清粉的真?zhèn)舞b別能力,且1D-GAP能在保持模型準確率的情況下,降低了模型的復雜程度,進而提升了模型的檢測速度,降低了模型大小。
3 預處理性能對比
為驗證光譜數(shù)據預處理對模型精度的影響,分別采用歸一化(NORM)、標準正態(tài)變換(SNV)、多元散射校正(MSC)、卷積平滑(SG)和去趨勢(DT)5 種預處理方法處理1.3.3節(jié)劃分的訓練集、驗證集和測試集,運用EG-1D-CNN模型進行訓練測試,最終測試結果如表2所示。
由表2可知,對于EG-1D-CNN模型,分別經過5 種預處理方法后的AAR與原始數(shù)據的AAR差異不大,且原數(shù)據所達到的AAR最高。這說明預處理對EG-1D-CNN模型的性能幾乎沒有影響,且在原近紅外光譜數(shù)據基礎上訓練的模型精度最高,故EG-1D-CNN模型無需對近紅外光譜數(shù)據進行預處理即可達到理想的精確度。
綜上所述,改進后的EG-1D-CNN模型可無需對原近紅外光譜數(shù)據進行預處理。由于略去了預處理步驟,且對于傳統(tǒng)機器學習算法,不同的檢測對象所需的光譜預處理方法都不同,不合適的預處理方法會降低模型準確率,該模型相比于傳統(tǒng)機器學習算法,無需光譜預處理的先驗知識,其建模方法更加方便。
4 不同模型性能對比
為比較改進的EG-1D-CNN與其他算法的性能,分別以傳統(tǒng)1D-CNN網絡結構、SE(squeeze-andexcitation)+1D-GAP模塊的1D-CNN網絡結構、CBAM(convolutional block attention module)+1D-GAP模塊的1D-CNN網絡結構、偏最小二乘判別分析(PLS-DA)方法和集成學習(EL)建立模型,用與2.2節(jié)相同的訓練集、驗證集和測試集進行模型的訓練及測試。最終的實驗結果分別如表3與表4所示。
由表3可知,相比于原1D-CNN模型,改進的EG-1D-CNN模型性能更加優(yōu)越。在 F FPR 和 F FNR 上分別減少了0.3 個和2.1 個百分點,且改進后的模型對于純蛋清粉沒有誤檢,在檢測速度指標上具有優(yōu)勢,其平均檢測時間減少了0.000 2 s,模型大小和FLOPs分別減少了0.77 M和0.12 M。相比于融合其他注意力模塊的模型,EG-1DCNN在檢測準確率指標和檢測速度指標上均為最優(yōu),更適合應用在蛋清粉近紅外光譜的真實性檢測中。
由表4可知,相比于PLS-DA,EG-1D-CNN在FFPR和FFNR上分別減小了2.10、3.57 個百分點,AAR提高了2.82 個百分點,相比于EL,在FFPR和FFNR上分別減小了1.64、4.72 個百分點,AAR提高了3.13 個百分點,這說明該模型無需對原近紅外光譜數(shù)據進行預處理即手動特征篩選,具有比傳統(tǒng)機器學習算法更強的分類性能,且由于EG-1D-CNN相比兩種傳統(tǒng)機器學習方法,在測試時省去了光譜預處理與特征波段篩選步驟,其在AATS上分別減少了0.002 3 s與0.000 7 s,滿足了快速檢測的要求。
綜上所述,改進后的EG-1D-CNN相比于其他改進1D-CNN模型及傳統(tǒng)機器學習模型,檢測準確率指標和檢測速度指標上均為最優(yōu),其 F FPR 可達到0%, A AR 達到了98.93%, A ATS 達到了0.004 4 s,可實現(xiàn)對大批量的蛋清粉樣本進行快速、準確的檢測,且由于EG-1D-CNN相比于其他模型復雜度更低,其模型大小僅占用1.18 M,能以較低成本將模型部署在嵌入式設備中,進而為實現(xiàn)蛋清粉便攜式近紅外光譜質量檢測儀的開發(fā)提供一定的基礎。
5 改進模型測試結果
EG-1D-CNN模型的真?zhèn)舞b別結果如表5所示,對于純蛋清粉樣本無錯檢,對于摻雜蛋清粉,其漏檢數(shù)僅為21 份,檢測率可達到97.80%,單組分、二組分、三組分摻雜的FFNR均在2.63%以下,AAR均在99%以上,這說明EG-1D-CNN模型對單組分及多組分的摻雜均有較高的識別率。且通過2.1.2節(jié)中的分析可知,多組分的光譜的特征區(qū)間更多,光譜特征為多個摻雜物特征的疊加,其光譜畸變更加明顯,更容易被檢測出其摻雜特征,故多組分摻雜的AAR會比單組分高,二組分和三組分的AAR分別可達到99.68%和99.83%。
具體的摻雜種類真?zhèn)舞b別結果如表6所示,針對每種摻雜種類分別統(tǒng)計了在不同濃度下的漏檢數(shù)以及LLRC。其中,LLRC在淀粉、大豆分離蛋白、三聚氰胺、尿素、甘氨酸上分別可達到1%、5%、0.1%、1%、5%,在多摻雜中可達到0.1%~1%。單組分的三聚氰胺特征由于其光譜圖特征最為明顯,鑒別率達到了100%,LLRC可達到0.1%,單組分、二組分、三組分摻雜的總LLRC分別可達到5%、1%、0.5%。
通過2.1.2節(jié)中的分析,對于單組分摻雜,由于三聚氰胺無論在低濃度和高濃度下,在6 800 cm-1左右處有明顯的波峰,所以三聚氰胺的LLRC可達到0.1%,而大豆分離蛋白和甘氨酸在低濃度條件下的光譜區(qū)分度較低,故相應的檢測精度較低,LLRC較高;由于富氮類化合物相比于增量劑摻雜物,光譜特征區(qū)域更廣,光譜畸變更加明顯,故富氮類化合物的總體檢測精度較高,總體LLRC相對較低;對于多組分摻雜,由于多組分摻雜光譜圖的特征區(qū)域更多,與單組分摻雜相比,該模型對于多組分摻雜有著更高的檢測精度,且三組分相比于二組分,光譜特征區(qū)域多一組,模型可檢測的特征區(qū)域更廣,故三組分的最高LLRC更低。
綜上所述,改進的EG-1D-CNN模型對于摻雜率超過5%的蛋清粉,可達到100%的鑒別率,針對部分富氮類(如三聚氰胺)摻雜物可達到0.1%的檢測限,且由于模型提取的光譜特征區(qū)域更明顯,針對多摻雜的檢測精度更高,其最高 L LRC 更低。該模型在蛋清粉的真?zhèn)螜z測方面有較高的準確度及精確度,對于單組分和多組分的混合摻雜都有較好的判別性能。
6 結 論
本研究針對蛋清粉真實性檢測問題,提出了一種改進EG-1D-CNN模型,可基于近紅外光譜數(shù)據對蛋清粉進行真?zhèn)闻袆e,該模型無需對原光譜進行預處理,且在原網絡結構基礎上增加了ECA與1D-GAP模塊,分別改善了模型的精度及復雜度,最終對于不同類型的樣本均實現(xiàn)了良好的判別效果:該模型的最終假陽性率(FFPR)可達到0%,對于摻雜蛋清粉的檢測率可達到97.80%,總準確率(AAR)為98.93%,最低檢測限(LLRC)在淀粉、大豆分離蛋白、三聚氰胺、尿素、甘氨酸上分別可達到1%、5%、0.1%、1%、5%,在多摻雜中可達到0.1%~1%,平均檢測時間(AATS)可達到0.004 4 s,模型大小占用為1.18 M,由于多組分摻雜光譜圖的特征區(qū)間及程度更明顯,該模型在多組分摻雜的鑒別表現(xiàn)比單組分更優(yōu),且相比其他的算法,該模型的性能均為最優(yōu)。改進后的EG-1D-CNN模型可實現(xiàn)對低濃度、多組分摻雜蛋清粉樣本的準確檢測,在蛋清粉的真實性快速檢測中顯示出巨大的應用潛力,且模型占用空間小,能以較低成本將模型部署于嵌入式設備中,為后續(xù)開發(fā)針對蛋粉質量檢測的便攜式近紅外光譜檢測儀提供一定的理論基礎。
為了使模型具有更高的精度、更快的檢測速度、更小的占用空間及更廣的適用范圍,未來的研究可以進一步優(yōu)化1D-CNN的模型結構,如隱含層結構的優(yōu)化,在保證準確度的同時,降低模型的復雜度,以優(yōu)化模型的速度及占用空間;選擇更多品牌的不同生產批次的蛋清粉、選擇更多的摻雜物、擴大摻雜物樣本數(shù)量,以提高模型的適用范圍;由于蛋清粉摻雜種類繁多,僅針對幾種的摻雜物檢測無法有效覆蓋市面上所有的摻雜物,為實現(xiàn)蛋清粉更廣的摻雜種類檢測范圍,建立基于無監(jiān)督學習的非定向檢測模型也是之后蛋清粉真實性檢測的一個重要研究方向。
作者簡介
第一作者:
祝志慧 副教授
華中農業(yè)大學工學院
教育經歷:
2005/9-2008/12,武漢大學,電力系統(tǒng)及其自動化,博士
2003/9-2005/6,華中農業(yè)大學,農業(yè)工程,碩士
1993/9-1997/6,武漢大學,電力系統(tǒng)及其自動化,學士
科研與學術工作經歷:
2012/12-至今,華中農業(yè)大學,工學院,副教授
2010/3-2012/12,華中農業(yè)大學,食品科技學院國家蛋品加工技術研發(fā)分中心,博士后
2008/12-2011/12,華中農業(yè)大學,工學院,講師
主要從事智能檢測與信息處理、實時在線監(jiān)測及自動控制技術等方面的科研工作,主講《農產品無損檢測技術》、《工程測試與信息處理技術》、《數(shù)學建模》等本科生與研究生重要課程。主持和參與中國博士后科學基金、湖北省自然科學基金,校青年創(chuàng)新基金、國家自然科學基金、公益性行業(yè)(農業(yè))科研專項子課題、國家科技支撐計劃項目、湖北省科技支撐計劃等11 項科研項目。在國內外重要學術期刊和會議上發(fā)表科研論文30 余篇,其中 SCI/EI 檢索 20 篇,出版學術專著2 部,授權發(fā)明專利6 項,授權軟件著作權9 項。研究成果先后獲“湖北省科技進步一等獎(排名第4)”、“湖北省科技技術發(fā)明二等獎(排名第2)”。
本文《基于改進一維卷積神經網絡模型的蛋清粉近紅外光譜真實性檢測》來源于《食品科學》2025年46卷6期245-253頁。作者:祝志慧,李沃霖,韓雨彤,金永濤,葉文杰,王巧華,馬美湖。DOI:10.7506/spkx1002-6630-20240830-232。點擊下方閱讀原文即可查看文章相關信息。
實習編輯:陳麗先;責任編輯:張睿梅。點擊下方閱讀原文即可查看全文。圖片來源于文章原文及攝圖網
為貫徹落實《中共中央國務院關于全面推進美麗中國建設的意見》《關于建設美麗中國先行區(qū)的實施意見》和“健康中國2030”國家戰(zhàn)略,全面加強農業(yè)農村生態(tài)環(huán)境保護,推進美麗鄉(xiāng)村建設,加快農產品加工與儲運產業(yè)發(fā)展,實現(xiàn)食品產業(yè)在生產方式、技術創(chuàng)新、環(huán)境保護等方面的全面升級。由 中國工程院主辦, 中國工程院環(huán)境與輕紡工程學部、北京食品科學研究院、湖南省農業(yè)科學院、岳麓山工業(yè)創(chuàng)新中心承辦, 國際食品科技聯(lián)盟(IUFoST)、國際谷物科技協(xié)會(ICC)、湖南省食品科學技術學會、洞庭實驗室、湖南省農產品加工與質量安全研究所、中國食品雜志社、中國工程院Engineering編輯部、湖南大學、湖南農業(yè)大學、中南林業(yè)科技大學、長沙理工大學、湘潭大學、湖南中醫(yī)藥大學協(xié)辦的“ 2025年中國工程院工程科技學術研討會—推進美麗鄉(xiāng)村建設-加快農產品加工與儲運產業(yè)發(fā)展暨第十二屆食品科學國際年會”,將于2025年8月8-10日在中國 湖南 長沙召開。
長按或微信掃碼進行注冊
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發(fā)布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.