靜網PWA視頻評論

基於貝葉斯推斷的多層軟測量建模在丁醇發酵中的應用

2023年10月29日

- txt下載

朱湘臨 顧雯煒 王博
摘要:針對丁醇生產過程中發酵產物品質參量難以實時測量,現有測量方法精度不高、測量結果受不確定因素影響較大的問題,提出一種基於貝葉斯推斷和支持向量回歸( Support vector machine regression,SVR)的多層軟測量建模方法。首先應用貝葉斯推斷計算後驗機率、篩選偏置數據,並對偏置數據校準,建立第一層SVR模型:然後利用貝葉斯推斷進行二次校準,建立第二層SVR模型,對第一層SVR模型輸出進行修正,得到最終預測結果,克服干擾和偏差引起的模型不準確問題。將基於貝葉斯推斷的多層支持向量回歸( Bi-SVR)預測模型應用於丁醇發酵過程,仿真及實驗結果表明,相較於傳統SVR預測模型,系統在低干擾的情況下預測精度提高了4.52%,在高干擾時預測精度提高了5.37%。
關鍵詞:微生物發酵;貝葉斯推斷;支持向量機回歸;軟測量
中圖分類號:TP319
文獻標識碼:A
文章編號:1672-7800( 2020)004-0183-06
0 引言
隨著科技的進步,各國能源開採和研究逐漸轉向可再生方向,生物能源以其可再生和低污染等優點成為現代能源研究的熱點。乙醇是美國石油危機以來最先進行研究的生物燃料,經過長期研究發現,和乙醇相比,丁醇具有更高的能量密度和燃燒值,能夠以任意比例和汽油混合使用,並且原有燃機不需要作任何改動就可直接使用,擁有廣闊的研究前景[1]。但是丁醇發酵過程複雜,涉及許多生物量,實現丁醇工業化生產需要克服其在線精準測量難題。
基於過程數據和預測能力的軟測量技術因其良好的測量能力得到學術界和工業界的關注[2]。軟測量方法可以歸結為兩種:①基於生物機理進行建模;②基於歷史數據驅動進行建模。前一種方法需要基於生物機理知識開發模型,這些模型用於闡明過程與結果這兩個變量之間複雜的物理、化學或生物關係[3]。因此基於機理知識的軟測量建模需要耗費很大的精力在機理研究上,極易影響軟測量建模的準確性。因此,僅取決於歷史數據的數據驅動軟測量技術更有研究和發展前景[4]。
早期軟測量技術的數據驅動建模方法集中於多元統計技術,例如偏最小二乘法( Partial least squares,PLS)。這類方法可以處理變量的共線性,但是PLS本質上是線性模型,不能處理非線性過程,除非內核函數等特定的非線性變化被整合[5]。人工神經網絡( Artificial neural networks,ANNs)已應用於構建非線性過程的軟測量模型。一些學者研究將神經網絡與PLS等多元統計技術結合用於非線性系統的軟測量技術[6]。利用人工神經網絡模擬過程中的非線性關係,PLS用來處理測量數據的共線性以及替換缺失值問題[7]。儘管ANN技術已被證明能夠處理系統非線性和代表過程知識,但其需要龐大的資料庫支撐,因此所訓練的一般模型預測效果較差。另外,神經網絡也可能會收斂到局部最小值,從而影響軟測量結果的準確性[8]。
獨立分量分析(Independent component analysis,ICA)和支持向量機( Support Vector Machines,SVM)也應用於軟測量技術開發。ICA可基於高階統計量提取相互獨立的分量,並識別傳統PLS方法無法處理的非高斯過程特徵[9]。現有的一些軟測量建模方法沒有充分考慮到實際生產中可能產生的不確定情況,包括缺失值、外部干擾所導致的測量誤差和漂移、樣本延遲和數據長度不規則等[10-11]。貝葉斯推斷作為處理系統不確定性的強大機率技術已經引起人們對過程系統各個領域的興趣,包括軟測量建模[12-13]。Yan等[14]提出用貝葉斯推斷法選擇SVM模型參數值並優化軟測量模型。之後有很多研究人員將貝葉斯推斷與SVM相結合進行建模,取得了良好的預測效果[15]。
本文將支持向量回歸與貝葉斯推斷相結合,借鑑神經網絡的深度學習方法思路進行多層建模,用於非線性生物丁醇發酵過程中的軟測量開發。首先,在預處理步驟中展開和縮放多路數據矩陣;然後,將過程變量的測量數據用於貝葉斯推斷,以此估計模型輸入空間內所有樣本的後驗機率,對相應後驗機率小於預定義置信水平的樣本子集用貝葉斯標識和校準估算。將處理過的輸入樣本與第一層輸出數據一起用於構建第一層支持向量回歸模型。同樣,用貝葉斯推斷篩選在置信度界外的後驗機率偏置數據;最後,由第一層預測模型的校準輸入和輸出數據進行擬合構建第二層SVR模型,得到準確的預測值。參數C的一組值。通過最小化平均根均值、多重交叉驗證,最後確定C=10,;σ=1是最佳選擇。
2 基於貝葉斯推斷的多層軟測量建模
為處理測量過程中可能出現的干擾、噪聲、樣本延遲和缺失值等問題,將貝葉斯推斷與支持向量回歸相結合,建立軟測量預測模型。假設過程變量的多路輸入數據矩陣是X(Ix Jx×L),輸出矩陣是Y(/x Jy×L)。這裡L表示批數,Jx和JY表示輸入及輸出變量的數目,L是每次發酵的觀測數。首先,利用動態時間規整( Dynamic time warping,DTW)技術對齊和同步不等長度的輸入數據;然後沿著每組變量列的不同採樣時刻進行數據堆疊,將多路輸入和輸出數據矩陣展開成兩維矩陣X(IL×Jx)和Y(IL×JY)[16-17],如圖1所示。
利用貝葉斯推理對輸入和輸出測量進行校準,構造第二層SVR模型,並將修正的輸入測量值反饋給該模型以預測最終輸出。對於任何一組測量數據,需要計算在任意採樣時刻,。上的同步數據向量的後驗機率,從而確定數據不確定性的重要性。對於任何有偏差的測量,可以應用基於貝葉斯推理的數據校準,將校準數據向量作為輸入直接發送到第二層SVR模型,以獲得不同質量屬性的預測。需要注意的是,第一層SVR模型僅是在訓練階段用於輸出數據校準,而第二層SVR才是作為學習和預測的主要軟測量模型。設計的貝葉斯推理方法能夠處理不同類型測量的不確定性,包括缺失值、傳感器偏差和漂移。與此同時,採用支持向量回歸方法對過程變量和輸出之間的非線性關係進行建模。
對基於貝葉斯推斷的多層支持向量回歸軟測量建模方法總結如下:①分別為輸入和輸出變量形成兩個多路訓練數據矩陣x和v;②使用動態時間彎曲技術對齊和同步數據長度;③對多路輸入和輸出數據矩陣進行可變智能展開,並將它們轉換成二維矩陣;④計算輸入樣本的後驗機率。對於相應的後驗機率小於顯著性水平a%的樣本標記為具有顯著不確定性的有偏測量;⑤基於貝葉斯推理對偏置輸入測量進行校準;⑥使用校準的輸入數據連同原始輸出樣本建立第一層SVR模型;⑦利用來自第一層SVR模型的預測輸出值,估計所有輸出樣本的後驗機率,並使用與步驟④相同的統計規則識別偏差測量;⑧對偏差輸出測度進行貝葉斯修正;⑨使用校準的輸入和輸出數據構建第二層SVR模型;⑩對於任何新的過程測量樣本,計算同步輸入向量的後驗機率並確定其是否顯著偏置;(11)偏置輸入測量數據校正,實現基於貝葉斯推理;(12)將無偏置或校準的輸入數據發送到第二層SVR模型,以獲得相應的質量變量預測。
圖2為該方法流程。
3 丁醇發酵多層軟測量應用
現代計算機技術的迅猛發展為發酵生產智能化奠定了良好基礎,準確和可靠的在線參數測量是不可或缺的環節,既可實時觀測和記錄生產數據,又可實現發酵生產中的精準控制。本文以丁醇發酵為例,應用多層軟測量建模方法進行數據的預測實驗,並與常規SVR方法下的預測結果進行比較分析。
3.1 丁醇發酵工藝
丁醇發酵不同於乙醇的「一步法」發酵,需要經過「兩步法」:先將木質纖維水解再向水解液中加入拜氏梭菌進行發酵生產,在發酵過程中會產生有毒物質抑制發酵[18]。實驗表明加入適量的碳酸鈣可實現脫毒效果,同時加入適量丁酸能起到促進丁醇生產的作用。發酵罐是發酵過程中的主要設備,需要提供微生物生長必需的養分、水、空氣和適宜的溫度[19]。在該過程中分別通過操縱酸/鹼和水溫控制發酵罐中的pH值和溫度。根據丁醇發酵工藝,酸鹼平衡添加物分別為碳酸鈣和丁酸控制發酵過程中的pH值。碳酸鈣起到抑制劑作用,丁酸起到促進丁醇生產的作用[20]剛。丁醇發酵過程如圖3所示。
在此過程中,選擇生產丁醇的4個最關鍵濃度變量作為軟傳感器輸出,其它6個測量變量用作輸人[21],輸入和輸出變量分別標記為I1-16和O1-O3,如表1所示。
3.2 多層軟測量預測結果比較
為形成訓練數據集,隨機取30次發酵數據,每次持續72小時。測試分為兩次,每次添加不同的干擾以驗證軟測量模型性能。因為丁醇發酵具有非線性、時變性和多相特徵等特點,所以本文採用RMSE指數評估軟測量模型性能:
其中( )和( )分別是第,個輸出變量的實際值與估計測量值。在低干擾情況下兩種不同類型的軟測量模型最終得到的預測結果如圖4、圖5和圖6所示。
同時,對SVR和Bi-SVR方法的軟測量建模及預測結果進行定量比較,見表3。
從軟測量預測結果可以看出,在所有3個輸出變量的預測精度方面,所提出的Bi-SVR方法優於傳統的SVR方法。在圖5中,SVR預測的菌體濃度與實際測量值有一定偏差,走勢基本一致但是缺乏精度。相比之下,Bi-SR方法的預測與實際測量值的軌跡基本吻合,偏差較小。由表3可知,Bi-SVR方法訓練和測試樣本的RMSE指數值均小於SVR法,表明所提出的Bi-SVR方法能夠有效處理干擾問題並糾正偏置測量。傳統的SVR方法會將偏置數據進行模型擬合從而導致模型的準確度下降。Bi-SVR方法可以利用貝葉斯推斷刷新偏置數據,並對具有偏差的輸入輸出進行校準。對於圖6中的葡萄糖濃度預測,SVR軟傳感器預測值與實際值偏差較大。相比之下,Bi-SVR方法在貝葉斯框架下具有最小的誤差。圖7中丁醇濃度的預測值在SVR和Bi-SVR方法下初期表現相差不大。當干擾出現時預測結果會出現波動,偏離實際值。可以看出,除了利用貝葉斯推斷進行偏置數據的校正之外,在貝葉斯框架中還保留了支持向量回歸機的固有泛化能力。
為了進一步驗證Bi-SVR方法在具有偏差測量數據下的性能,在第二個測試樣本中加入更高干擾。圖7、圖8和圖9比較了輸出變量的預測。
如圖8、圖9和圖10所示,SVR方法的預測值與實際輸出的測量值具有較大誤差,該模型對隨機誤差或干擾的響應較差,當高干擾出現時預測會出現明顯偏差,與實際值偏離較大,不能準確進行輸出預測。Bi-SVR方法在高干擾情況下也會出現一些波動,但其預測值與實際值相差較小,只是穩定性有所下降。
表4為兩種軟測量方法在高干擾情況下的預測輸出RMSE值。雖然在高干擾測試中Bi-SVR方法的RMSE值比低干擾大,但是對比所有的輸出變量,它們仍然小於SVR方法的預測值。與SVR方法相比,Bi-SVR方法在丁醇濃度的平均預測RMSE低達0.025,遠小於0.144。其它兩個輸出變量預測結果更差,而Bi-SVR方法在這兩種情況下始終保持良好的預測結果。該測試很好地證實了Bi-SVR方法處理實際問題過程中,對不同程度干擾和測量非線性、時變性系統的超強能力和有效性。
4 結語
本文提出一種新的基於貝葉斯推斷的多層支持向量機回歸框架,用於丁醇發酵的多層軟測量建模。該方法將貝葉斯推斷與第一層SVR模型結合起來,以篩選出具有偏差的輸入和輸出值。第二層SVR模型建立在校準之後的數據樣本之上,有效避免了干擾和偏差引起的模型不準確問題。而傳統的SVR方法受此影響,其預測能力因測量偏差和誤差而顯著降低。
將所提出的Bi-SVR方法應用於丁醇發酵過程中,並將其性能與常規SVR方法的軟測量預測能力進行比較,兩次測試樣本具有不同水平干擾。預測結果表明,Bi-SVR方法能夠得到更準確的預測輸出,優於傳統SVR方法,具有更高的魯棒性。以貝葉斯推斷的自我協調能力與非線性處理能力,結合從支持向量機繼承強大的泛化能力集成的Bi-SVR方法,有望成為微生物發酵過程的優選軟測量建模方法。
參考文獻:
[1] 高越,郭曉鵬,楊陽,等.生物丁醇發酵研究進展[J].生物技術通報,2018,34(8):27-34.
[2] 姜哲宇,劉元清,朱湘臨,等.基於KFCM和AMDE-LSSVM的軟測量建模方法[J].計算機測量與控制,2018,26(8):46-50,92.
[3] 高世偉,趙力.一種基於支持向量機的軟測量建模方法[J].自動化儀表,2017,38(7):42-45.
[4] 張亞男.基於相關向量機的軟測量建模技術及應用研究[D].無錫:江南大學,2017.
[5]潘宇雄,任章,李清東.動態貝葉斯最小二乘支持向量機[J].控制與決策,2014,29( 12):2297-2300.
[6]邱禹,劉乙奇,吳菁,等.基於深層神經網絡的多輸出自適應軟測量建模[J].化工學報,2018.69( 7):3101-3113.
[7]LIU S T, GAOX W, QIWH, et al. Soft sensor modelling of propyleneconversion based ona Takagi-Sugeno fuzzy neural net,vork optimizedwith independent component analysis and mutual information [J].Transactions of the Institute of Measurement and Control, 2019. 41 (3):193-199.
[8]秦雲月.基於支持向量機和神經網絡模型的識別[J].電子技術與軟體工程,2018(13):247-248.
[9] 楊凱,孫玉梅,王莉,等.基於ICA變量分組的集成軟測量方法研究[J].北京理工大學學報,2018,38(6):631-636.
[10]ZHENG W,CHENG S,LI Z.Soft-sensing modeling and intelligentoptimal control strategy for distillation vield rate of atmospheric distil-lation oil refining process[ J]. Chinese Journal of Chemical Engineer-ing, 2018(6):964-968.
[11]湯文超.基於貝葉斯網絡和支持向量機的尾礦庫潰壩風險預警方法研究[D].武漢:武漢理工大學,2017.
[12] 陳若曦.基於貝葉斯證據框架優化的LS-SVM預測模型在空間電力負荷預測方法中的應用研究[D].天津:天津理工大學,2017.
[13]YU X K, LI J X, XU J.Nonlinear filtering in unknown measurementnoise and target tracking system by variational bayesian inference[J]. Aerospace Science and Technology, 2018(5):175-179.
[14]YU J.A nonlinear kernel gaussian mixture model based inferentialmonitoring approach for fault detection and diagnosis of chemical pro-cesses[Jl. Chemical Engineering Science, 2012, 68(1):506-519.
[15]夏莘媛,戴靜,潘用科,等.基於貝葉斯證據框架下SVM的油層識別模型研究[J].重慶郵電大學學報(自然科學版),2016, 28(2):260-264. 272.
[16] 方雲錄,苗茹.時間規整耦合線性判別分析的動作識別算法[J].計算機工程與設計,2018.39(11):3468-3474, 3499.
[17] 馬科,符春曉,劉建,等.基於DTW的貝葉斯方法在睡眠和喚醒分類中的應用[J].計算機系統應用,2018,27(1):195-200.
[18]蔡的.連續發酵生產生物丁醇新工藝[D].北京:北京化工大學, 2013.
[19] 聖亞春.拜氏梭菌F-6合成丁醇發酵工藝優化及其動力學研究[D].哈爾濱:哈爾濱工業大學,2017.
[20]ZHOU Q, LIU Y, YUAN W Q.Kinetic modeling of lactic acid andacetic acid effects on butanol fermentation bv clostridium saccha-roperbutylacetonicum[ Jl. Fuel, 2018( 226): 1050-1057.
[21] MYUNC OH JANG, GYUNCHYUN CHOI. Techno-economic analy-sis of hutanol production from lignocellulosic biomass bv concentrat-ed acid pretreatment and hydrolysis plus continuous fermentation[J].Biochemical Engineering Journal, 2018( 134): 957-963.
(責任編輯:杜能鋼)
作者簡介:朱湘臨(1963-),男,江蘇大學電氣信息工程學院教授、碩士生導師,研究方向為微生物發酵設備及其檢測技術;顧雯煒(1995-),男,江蘇大學電氣信息工程學院碩士研究生,研究方向為工業過程檢測與優化控制;王博(1982-),男,博士,江蘇大學電氣信息工程學院副教授、碩士生導師,研究方向為複雜工業過程的建模與優化控制。

收藏

相關推薦

清純唯美圖片大全

字典網 - 試題庫 - 元問答 - 简体 - 頂部

Copyright © cnj8 All Rights Reserved.