Bayesian machine learning for inverse design of ultra-highperformance concrete
貝葉斯機器學習在超高性能混凝土逆向設計中的應用
https://royalsocietypublishing.org/rsta/article/383/2305/20240041/234826/Bayesian-machine-learning-for-inverse-design-of
![]()
可用原材料的多樣性,加之嚴苛的性能要求,使得超高性能混凝土(UHPC)的設計變得復雜。本文首先基于已發表的UHPC數據,展示了一種貝葉斯逆向設計方法。材料在一種分層機器學習框架下進行表征;本研究的一個核心目標是:比較以成分變量為參數的模型與以基于經驗模型提取的潛在變量(latent variables)為參數的模型在預測精度與泛化能力方面的差異。
首先,數據通過集成嶺回歸(ensemble ridge regression)進行建模;以“校準偏差面積”(miscalibration area,一種貝葉斯誤差度量指標)評估發現:相較于以成分變量為參數的模型,以潛在變量為參數的模型展現出更優的泛化能力。隨后,研究采用基于擴展特征集的高斯過程回歸(Gaussian process regression)來預測抗壓強度;出人意料的是,以成分變量為參數的模型取得了更高的預測精度(測試集),而以潛在變量為參數的模型精度較低(測試集)。然而,后者在預測使用未經測試細骨料的設計性能時更為準確,并成功預測出若干新型配比,其抗壓強度表現優異——這與模型校準偏差誤差的顯著降低相一致。
上述結果表明:在貝葉斯機器學習框架中,潛在變量能夠提供更廣義的變量空間泛化能力,對未經測試的原材料實現穩健預測,并可指導發現具備最優性能的新型UHPC配比。
本文屬于主題特刊《科學與工程中應用型反問題的前沿》(Frontiers of applied inverse problems in science and engineering)的一部分。
引言
膠凝材料的組分復雜性——包括水泥種類、細骨料與粗骨料、輔助膠凝材料(SCM)、外加劑及纖維等——構成了一個高維輸入變量空間;在該空間中,需在成本、原材料可得性與環境影響等多重約束下,對一系列相互競爭的性能指標(如流動性、凝結時間、強度與耐久性)進行協同優化[1, 2]。然而,對這類材料開展預測建模的核心困難在于組分本身的變異性:即便標簽相同(如CEM I水泥、砂、粉煤灰),不同來源的材料可能因其底層原材料分布廣泛而對最終材料性能產生顯著差異。
![]()
其一,超大規模數據集(尤其是源自現場測試的混凝土性能數據)往往質量低于受控實驗室數據,導致組分與工藝變量的標定以及響應測量結果中誤差風險更高;其二,密切相關的問題是:不同來源的原材料雖標簽相同,但其化學與物理特性及其對材料性能的影響可能迥異,使得在名義配比相同而實際響應不同的情形下,回歸建模變得復雜;其三,一個較少被關注的問題是:構建模型所依據的變量(或特征)在響應曲面上的預測能力可能不均一,從而導致在有限配比范圍內訓練出的模型無法良好泛化,并產生過度自信的不確定性估計。例如,僅基于化學計量學(stoichiometry)預測材料性能時,面臨建模一個龐大響應曲面的挑戰,而實際可獲數據僅覆蓋其極小部分。在機器學習中,可通過構建模型集成(ensemble of models)——即每一模型代表對特定配比的一種假設性預測——來理解并應對這一挑戰[5]。
因此,亟需一種建模框架,能夠對組分變量的分布進行合理估計,并在參數空間廣泛范圍內實現高精度泛化,尤其是在訓練數據稀疏的情況下。貝葉斯模型已被應用于高性能混凝土的設計,并被證明是一種強大工具:例如,Zhang 等[6]基于包含400余個樣本(以波特蘭水泥、高爐礦渣、粗骨料等成分信息表征)的訓練集,實現了對強度的高精度預測。該工作代表了當前建模技術的前沿水平,但其性能評估僅基于原始數據集的訓練/測試劃分。換言之,該模型對訓練數據中所涵蓋的原材料特性分布擬合極佳,但其泛化能力尚不明確[6]。顯式以潛在變量(latent variables)為參數的分層模型(hierarchical models),是提升機器學習算法泛化性與可解釋性的有力工具。將物理約束嵌入機器學習模型可顯著增強其預測能力,多項近期研究反映了該方向的快速發展[7–9]。
本文將成分變量與潛在變量應用于超高性能混凝土(UHPC)的建模與優化,并采用貝葉斯機器學習框架[10],以顯式刻畫傳統建模與優化中極具挑戰性的材料特性底層分布。UHPC是一類基礎設施材料,其特征為高膠凝材料含量(含輔助膠凝材料與細骨料)、極低水膠比,且必須使用高效減水劑。此類材料定義為抗壓強度超過150 MPa、開裂后抗拉強度不低于5 MPa[11],通常還需摻加鋼纖維以實現上述力學性能[12, 13]。由于其低水含量且不含粗骨料,UHPC的膠凝材料用量約為普通強度混凝土的三倍[14]。
目前,UHPC的應用正日益廣泛:成功案例包括——預制混凝土梁(其力學性能與同截面深度的鋼梁相當)[15];用于加速橋梁施工中連接預制橋面板與梁體的“閉合澆筑”(closure pours)[16, 17];以及路面罩面[18]與結構修復[19]等。改進UHPC設計范式,有助于提升原材料選擇與配比設計的靈活性,例如支持就地取材、應用新興材料或變異性更大的材料,從而潛在地提升經濟性與可持續性,推動UHPC更廣泛實施[20, 21]。
近期,傳統數據分析方法已獲機器學習技術補充。機器學習是一類多樣化的統計算法,可用于預測系統性能,現正逐步廣泛應用于基礎設施材料領域,包括UHPC[22, 23]。例如,Ghafari 等[24]基于53種不同UHPC配比訓練人工神經網絡(ANN),所優化配比的實測抗壓強度與預測值偏差在5%以內。盡管該最優配比未能外推至訓練集范圍之外的新配比設計,但該ANN仍優于基于多元線性回歸的傳統統計混料設計方法。然而,該ANN以訓練集中特定材料為參數,其預測能力局限于這些特定組分;對于粒徑、比表面積或反應活性不同的同類材料,該模型泛化能力不足,需額外實驗以重新訓練機器學習算法。
對于小規模數據集,提升泛化能力的一種方法是采用潛在變量表征體系——即那些未被直接觀測或測量、但反映支配性能的潛在因素的變量[25, 26]。基于現有文獻中基于顆粒緊密堆積與水膜厚度(WFT)方程的配比優化研究,本文提出一種分層機器學習(HML)模型[27–29],用于UHPC抗壓強度的預測與優化。文獻數據以潛在變量進行編碼:其一為顆粒堆積特性(通過可壓縮堆積模型(CPM)[30]量化),其二為初始自由水量(由WFT定義)。該方法可泛化至未經測試的、具有不同粒徑、反應活性與比表面積的材料。基于一組由不同來源材料設計并制備的UHPC驗證樣本,該模型成功預測出高抗壓強度的新型UHPC配比。
支配超高性能混凝土性能的潛在變量
UHPC強度的發展源于化學、物理與力學等多重機制;盡管其基本原理總體上已被理解,但組分配比參數空間的復雜性使得以強度為目標的設計極具挑戰性。化學強度的提升主要歸因于輔助膠凝材料(SCM)所引發的火山灰活性反應。SCM是一類由二氧化硅(SiO?)和氧化鋁(Al?O?)組成的無定形材料,其本身并不具備膠凝性;相反,諸如硅灰、偏高嶺土和粉煤灰等SCM,可與波特蘭水泥水化產物中的游離氫氧化鈣(CH)發生反應。這一火山灰反應生成了高強度的無定形水化硅酸鈣(C–S–H)和水化鋁酸鈣(C–A–H)相[31]。在UHPC中,偏高嶺土與硅灰因其高純度與高比表面積(SSA)而被廣泛研究——高比表面積可顯著促進火山灰反應的進行[32, 33]。
UHPC強度在物理層面的根本提升源于其微觀結構中孔隙率的最小化[34]。在UHPC中,存在多種類型的孔隙形成機制:
第一類為C–S–H與C–A–H水化相內部的層間間距,其孔徑介于5至25 ?之間,處于范德華力作用范圍之內,因此對水泥強度無顯著不利影響[35];
第二類為毛細孔隙(capillary pores),其數量與水泥強度呈負相關,孔隙尺寸與連通性則直接隨水膠比(w/c)升高而增大[36];
第三類孔隙形成于UHPC中水化水泥漿體與骨料相之間的界面過渡區(ITZ)。通常,ITZ被視為混凝土中強度最低、起控制作用的薄弱環節[35]。由于ITZ的厚度與骨料粒徑成正比,UHPC中僅使用細骨料(即砂與石粉),而不摻加粗骨料[37]。此外,通過使用具有火山灰活性、高比表面積的SCM,可進一步降低ITZ內的孔隙形成:一方面,火山灰反應增強化學鍵合;另一方面,顆粒緊密堆積提升物理相互作用[38, 39]。
盡管目前尚無一個能夠全面涵蓋上述機制之間復雜相互作用與關聯的完整理論模型,本文旨在通過基于這些機理特征的機器學習建模,對這些相互作用加以解耦與解析。
傳統上,為最小化UHPC中ITZ的孔隙率,常采用最大化顆粒堆積密度的策略。兩種常見的UHPC配比優化模型包括:修正的Andersen–Andreasen模型與可壓縮堆積模型(CPM)。修正的Andersen–Andreasen模型[40]結合顆粒粒徑分布與一個可調參數 q ,生成理想的級配曲線;實際配比可通過手動調整 q 值擬合該曲線,從而尋求最優堆積密度。CPM由de Larrard首次提出,可計算堆積指數 K ,并將其優化至指定目標值;例如,對自密實混凝土拌合物,推薦 K = 4
[41]。
降低UHPC孔隙率的第二個關鍵因素是采用低水膠比(w/c)。該比值通過限制體系中未反應水的總量,從而抑制毛細孔的形成[34]。需注意的是:堆積密度僅取決于混合物的固相含量與顆粒粒徑;而水膜厚度(WFT)參數則進一步考慮了水含量及可供水分吸附的顆粒比表面積[42]。即便堆積密度已優化,過量的水仍可能導致毛細孔生成。研究表明:顆粒堆積密度的提高通常帶來抗壓強度的上升,而WFT的增大則導致強度下降[43]。根據固體顆粒的粒徑與比表面積,以及水膠比的不同,顆粒堆積、WFT與SCM反應活性三者之間存在復雜的協同與權衡關系。
此外,摻加非連續纖維增強是提升UHPC力學性能的另一重要策略。鋼纖維通常摻量為2–3%,最高可達6%[44],其主要作用在于緩解材料的脆性行為。在外部荷載作用下,鋼纖維可抑制微裂縫的生成或調控裂縫擴展路徑;其增韌效應顯著提升了UHPC的抗壓、抗彎與抗拉強度[45]。
實驗
貝葉斯機器學習模型基于從文獻中整理的數據進行訓練。這些數據集的選擇依據以下標準:
(1)所有配比均旨在實現符合UHPC標準的強度;
(2)不含粗骨料,粗骨料定義為平均D50粒徑不超過600 μm(即)的最大顆粒;
(3)所有細骨料材料均具有實測的D50值,以便在分層模型中準確表征中間層;
(4)包含在室溫下養護的樣本,以排除蒸汽養護和熱養護方法對強度增長機制的影響。
在基于文獻數據訓練模型后,實驗室中進行了獨立實驗,以驗證GPR模型所預測的部分優化結果——實驗所用材料與方法如下所述。
(a) 材料
用于驗證實驗的水泥砂漿采用ASTM C150 I型波特蘭水泥(Lafarge Holcim, Duluth, GA)、偏高嶺土(MetaMax, BASF)及硅灰(Elkem Materials, Inc.),并配合使用亞角形砂(River Sand Inc., Buford, GA,平均粒徑600 μm)。配比中還包含聚羧酸醚類高效減水劑(MasterGlenium 7920, BASF)以及鋼纖維(Dramix, Bekaert,長度13 mm,直徑0.20 mm)。水泥組成為:C?S 58%、C?S 18%、C?A 2%、C?AF 13%、CCbar 2.5%,比表面積(Blaine細度)為394 m2/kg。
(b) 強度評估
所有拌合物均在容量為9.5升的反向攪拌機(Hobart C100,帶槳葉附件)中按850 cm3批次制備。混合程序參考多篇關于UHPC拌合開發的論文[12,46,47]調整而成:首先,將烘干砂與輔助膠凝材料(SCMs)低速攪拌2分鐘;隨后加入水泥,繼續低速攪拌1分鐘;接著在30秒內逐步加水,同時持續低速攪拌30秒;然后加入超塑化劑,再低速攪拌10分鐘。隨后測試漿體流動性,若滿足要求則澆筑試件;若需進一步調整流動性,則每次添加2 mL超塑化劑,并額外攪拌2分鐘,直至拌合物流動度達到9英寸或以上。之后重復上述流程,僅調整超塑化劑用量。此方法確保所有拌合物均在相同攪拌時長下進行評價。超塑化劑在加水后添加,是因為已有研究表明延遲其加入可提高自密實混凝土與UHPC的流動性[48,49]。在加入纖維前,允許拌合物靜置一段時間以增強內聚性,隨后立即澆筑。每種配比制備六塊立方體砂漿試件(5.08 × 5.08 cm),用于抗壓強度測試。試件在23°C石灰水浴中養護,在7天和28天齡期進行測試,加載速率按每秒136 kg施加于未處理(未打磨)的澆筑面[50]。
(c) 數據采集
為訓練與測試模型,從已發表文獻中收集并匯編了一個UHPC配比數據庫[24,33,34,51–68]。這些數據已整理并發布于一個公開數據集[69]。從中選取四個數據集用于模型訓練,其概要見表1。為驗證本實驗室自制UHPC配比樣品,所收集的數據集限定為20°C養護、28天抗壓強度超過100 MPa的樣本。選擇低于常規UHPC下限強度的數據,旨在擴展訓練數據集的性能空間,從而支持更廣泛的預測范圍,并容納設計參數值更大的變異性。表2列出了四篇文獻中所有UHPC組分各自的取值范圍。由表1與表2可見,這些數據基本代表了UHPC混合物中常見的組成成分。然而,盡管硅灰、偏高嶺土(或相對純凈的煅燒黏土)及粉煤灰是混凝土(包括UHPC)中最常用的SCM,其他SCM(如礦渣、相對不純的煅燒黏土)并未被納入該數據集。這可能限制模型的泛化能力,尤其當SCM反應活性顯著偏離訓練集中所含材料時。不過,正如第4a(i)節所述,礦渣已被計入潛在變量訓練集中所使用的等效水泥含量中。
![]()
由于攪拌方法——包括攪拌能量、材料加入順序與時序,以及攪拌設備類型與容積——對實現UHPC的均勻性尤為關鍵,因此需特別注意各數據來源中攪拌工藝的差異性。在用于模型訓練的四個數據來源中,其中三個提供了詳盡的攪拌流程[20, 30, 44],另一個則僅提供部分信息[31]。對于提供詳細信息的數據源,其共同步驟均為:先干拌所有固相組分,隨后加水與超塑化劑,纖維則最后加入;本文§3b節所述驗證性試拌的制備流程即遵循此通用順序。
然而,各研究中所用攪拌設備類型存在差異:文獻[30]采用10升容量的逆流式攪拌機(與本文所用設備相似);文獻[31]與[44]則同時使用了臥式砂漿攪拌機和工業級“蛋糕攪拌機”(容積未說明,但其攪拌作用機制可能與逆流式攪拌機相近);而文獻[20]未明確說明攪拌設備類型。盡管部分早期UHPC研究曾報道過極長的攪拌時間,但依據上述攪拌程序,通常可在20分鐘內實現良好的均勻性[30]。
計算方法(a) 數據表征
記錄了每單位體積拌合物中水泥、sSCMs(硅質輔助膠凝材料,如硅灰、偏高嶺土等)、填料(如石英粉)、骨料(即砂)、水、超塑化劑及鋼纖維的用量。此外,各配比的養護溫度及28天抗壓強度結果也被作為數據集的輸出變量納入。所有訓練樣本中報告的配合比參數均按整個拌合物(包括固相與液相)的總質量進行歸一化處理,并依據各相預設的比重進行換算。
各數據源提供的細骨料平均粒徑(D50)與比表面積(SSA)被直接采用;而對于已記錄粒徑的SCM材料,若其粒徑未明確給出,則采用表3所列的典型常規取值進行估算——這些數值基于佐治亞理工學院(Georgia Tech)實驗所用材料的實測結果。
![]()
模型中選用了四個參數作為配比的潛在變量表征:等效水泥含量、混合物顆粒堆積密度、水膜厚度(WFT) 以及一個纖維摻量對抗壓強度影響的經驗關系式。除上述潛在變量外,模型還納入了三種在任意UHPC配比中均常見的成分特征變量:超塑化劑含量、水含量與水泥含量。這些參數的選取基于對水泥基材料中已有經驗關系的認知,旨在引導分層機器學習(HML)模型從原始成分層(compositional layer)向中間層變量(middle-layer variables)映射,如圖1所示。
![]()
(i) 等效水泥含量
“等效水泥”概念最早出現在大體積混凝土溫控研究中[70]。在本研究的應用中,該指標用于估算水化反應在28天內所產生的水化熱總量,而水化熱又與強度發展產物(如C–S–H、C–A–S–H相)的生成量密切相關,因此預期其與抗壓強度存在正相關性。
在式(4.1)中,各組分按其在28天水化期內對水化熱的貢獻,被換算為等效的水泥質量。例如,F類粉煤灰雖具火山灰活性,但其反應速率遠低于普通波特蘭水泥,故其用量在計算中乘以0.5(見式4.1)。該概念作為一種領域知識被引入模型,用以在缺乏量熱實驗數據的情況下,依據各類SCM對水化熱的相對貢獻,評估拌合物的整體反應活性。
![]()
(ii) 顆粒堆積
將顆粒堆積作為潛在變量引入,需設定一個參數來表征初始狀態下被水填充的孔隙率。本研究采用的堆積模型基于可壓縮堆積模型(CPM),該模型已被證實適用于多組分、粒徑分布寬泛(多分散)的體系,并被視為UHPC設計的理論基礎之一[71–73]。CPM將整個混合物的堆積狀態簡化為單一參數 K K: K K 值越高,表明顆粒堆積越緊密,對應抗壓強度也越高。
顆粒堆積也被認為是決定水泥基材料在塑性態與硬化態下性能的關鍵因素之一;它可作為設計變量,用于提高細骨料與輔助膠凝材料(SCMs)的摻量,并調控其性能。參數 K K 的計算由以下分量構成:
![]()
![]()
強度被假設與堆積指數(K)相關,使其成為該模型中一個潛在的潛在變量特征。基于每種 n 個組分的粒徑分布,確定松散系數(a??)和壁面系數(b??),并用于計算每個粒徑(Φ?*)所能達到的最大體積,類似于研究 [74] 所示,表明顆粒堆積模型可用于預測這些體系中的流動性和強度,尤其是在早期齡期。為此創建了一個 Python 腳本,用以表征每種混合物,而無需直接測量實際的堆積密度;其中 φ 計算為(1 - 水分數),而 β 對于每種 UHPC 配合比均保持恒定。
(iii) 水膜厚度
水膜厚度(WFT)是混合物中水量與顆粒表面積之間的關系。在普通混凝土中,較高的 WFT 值對應更高的工作性[42]。為實現 UHPC 所需的強度,必須在混合物中使用極少量的水——甚至低于完成水泥完全水化所需的水量——以最小化初始固有孔隙率。
在膠凝體系中,孔溶液相分為兩種不同類型[75]:第一種是填充水,即填充固體顆粒內部孔隙的水,不參與改善工作性;第二種是在這些孔隙被填滿后剩余的多余水分,其表達式見公式 (4.6)[76]。
![]()
水膜厚度(WFT)已被證明與水泥漿體的流變性能和強度密切相關[43],因而被視為UHPC中一個潛在的重要潛在變量。然而,與CPM不同的是,WFT的計算還需考慮膠凝顆粒的平均比表面積(SSA):比表面積的增加會導致WFT相應降低[42, 75]。由于這些配比的實際堆積密度(ф)并未實測,因此采用式(4.8)計算孔隙率(u):
![]()
φ = (1 - 水含量)。
這提供了一種一致的方式,用于表示每種配比的 φ 值,而無需直接測量其堆積密度。
(iv) 超塑化劑含量
盡管超塑化劑可賦予UHPC良好的工作性,但過量添加超塑化劑可能導致強度發展延遲[77]。因此,對于分層機器學習(HML)模型而言,考慮超塑化劑的摻量并平衡工作性與強度發展至關重要。由于超塑化劑含量與水膜厚度(WFT)或顆粒堆積所代表的潛在變量無直接關聯,出于上述原因,該底層成分參數被作為中間層參數引入,以幫助模型理解:為獲得可施工拌合物所需超塑化劑用量與性能之間的權衡關系。
(v) 纖維關系
通常,UHPC中鋼纖維體積摻量為2–3%[78]。纖維含量與水膜厚度(WFT)或顆粒堆積所代表的潛在變量無關;基于此,本文采用Siwinski等人[79]提出的經驗關系式,將UHPC配比中的纖維摻量與抗壓強度的相對提升值相關聯,表達式如下:
![]()
(b) 機器學習模型
貝葉斯定理基于構成某一事件的各因素的概率(即先驗概率與似然度),來確定該事件的后驗概率。大多數機器學習方法在預測系統性質或響應時僅提供最大似然估計,除非進行直接驗證,否則難以評估預測質量。相比之下,貝葉斯預測通過顯式估計底層統計分布,可同時給出預測的均值與方差,從而為理解與優化復雜系統提供了有力工具。
本研究采用兩種貝葉斯方法對UHPC強度數據進行建模:第一種方法引入了一種名為校準偏差面積(miscalibration area)[80]的替代性評估指標,用于比較以成分變量(HML底層)為參數的模型與以潛在變量(HML中間層)為參數的模型性能,除傳統指標(如均方根誤差RMSE或決定系數 R 2 )外,提供更深入的不確定性評估;第二種方法則用于建模、物理解釋與優化。二者結合,共同展示了貝葉斯方法在水泥與混凝土建模中的強大能力。
在第一種方法中,我們通過貝葉斯優化(BO)估計后驗分布,以比較以成分變量(HML底層)為參數的模型與以潛在變量(HML中間層)為參數的模型的不確定性。在BO的每次迭代中,均可通過對該后驗分布進行采樣,生成對后驗概率密度函數的近似。采用貝葉斯分析——即對參數的后驗分布進行邊緣化處理——旨在同時提升模型的準確性(即對訓練數據的擬合程度)與泛化能力(即對驗證集中新配比抗壓強度的預測能力)。
誤差分析通過兩類指標進行:
- RMSE:一種忽略貝葉斯概率的預測評分,僅衡量數據均值與最優模型預測值的擬合優度;
- 校準偏差面積:一種基于Kuleshov等人[81]提出的校準技術、對模型不確定性進行量化的指標。
標準貝葉斯不確定性估計(如高斯過程回歸GPR所產生的結果)常因模型偏差而低估真實不確定性——例如,當模型特征在整個輸出域內不具備恒定預測能力時,90%可信區間實際覆蓋真實值的頻率可能遠低于90%。校準偏差面積正是為提供更準確的不確定性量化框架而提出,可作為評估模型質量的替代性指標。
校準偏差誤差采用一種預測不確定性方法:該方法不僅給出預測值,還以“X%可信區間”的形式量化不確定性,目標是使真實值落入該區間內的頻率為X%。隨后,利用一個獨立的留出測試集,統計各可信區間實際包含真實值的比例。對X%從0到100%逐一進行上述測試,計算目標覆蓋率(X%)與實測覆蓋率之間的平均偏差(對所有X%取平均),所得即為校準偏差面積。該貝葉斯度量反映了模型不確定性估計對真實值位置的捕捉能力;換言之,模型可依據給定特征,判斷其對每個測試點的預測是優是劣。本文將利用該方法,探究以潛在變量(而非成分變量)參數化復雜系統時所產生的權衡關系。
在第一類近似貝葉斯推斷中,我們構建了一個概率集成模型,包含20個嶺回歸模型(即帶L2正則化的線性模型),分別以訓練數據的底層(成分變量)與中間層(潛在變量)為參數進行擬合。集成中每個子模型的正則化強度與初始隨機狀態均獨立隨機設定。在對給定數據集完成訓練后,各模型以輸入的成分變量或潛在變量取值作為參數,構建對該輸入函數后驗分布的高斯近似,從而得到對數據集中每一點預測值的均值與方差估計。為將預測推廣至驗證集,我們對后驗方差參數施加了一個單調變換——該變換基于Wille等人[61]數據集的統計結果計算得出——從而生成一個校準性能更優的修正后驗近似。
在第二類貝葉斯建模中,首先對中間層特征空間進行擴展:引入交叉項(即潛在變量兩兩乘積)以表征變量間的交互作用;隨后采用特征選擇方法,篩選出與抗壓強度相關性最強的特征子集,這些特征被認為代表了支配材料性能的關鍵潛在變量。數據集被隨機劃分為80%訓練集與20%測試集。在將抗壓強度分解為來自物理化學作用及其交叉項貢獻的過程中,采用Lasso回歸[82](即L1范數正則化回歸)結合十折交叉驗證進行變量選擇;而成分變量表征響應曲面時則未使用特征選擇。除提升預測精度外,基于潛在變量的特征選擇還可增強模型在中間層上的可解釋性[27, 29]。
隨后,采用高斯過程回歸(GPR)作為機器學習方法,基于Lasso篩選出的特征預測UHPC抗壓強度,并將其預測性能與直接采用底層成分變量空間訓練的GPR模型進行對比。
GPR是一種貝葉斯方法,可同時學習每個預測點的預測均值與誤差范圍的后驗概率分布。它通過一種稱為協方差函數(或稱核函數)的距離度量,從訓練數據中學習函數分布[83]。在預先設定均值函數與協方差函數的前提下,GPR依據訓練數據推導出后驗分布。與許多機器學習方法常用的交叉驗證不同,GPR通過對數邊緣似然(log marginal likelihood)的優化過程來更新協方差函數中的超參數[84]。
本研究中的強度預測模型以抗壓強度為輸出變量,所有輸入特征均采用scikit-learn庫中的StandardScaler方法進行標準化處理;GPR建模則調用scikit-learn中的GaussianProcessRegressor模塊,并采用標準的徑向基函數核(RBF核)[85]。訓練與評估策略與Lasso模型一致:數據集按80%訓練集、20%測試集劃分。
結果與討論(a) 集成嶺回歸與貝葉斯優化
采用嶺回歸構建的底層(圖2a,b)與中間層(圖2c,d)不確定性集成模型結果如下所示。均方誤差(MSE)、均方根誤差(RMSE)及校準偏差面積列于表4。
![]()
![]()
對比圖2a與圖2c中的等值線圖(parity plots)可見,兩類模型中各樣本點的預測均值均圍繞45°對角線聚集,表明模型在預測抗壓強度時未出現系統性高估或低估偏差。每個數據點所對應的RMSE(以誤差棒形式表示)隨樣本而異,但通常占預期值的相當大比例——這歸因于數據集規模較小,以及用于建模的成分變量與潛在變量模型相對稀疏。以成分變量為參數的不確定性模型RMSE(20.6 MPa)小于以潛在變量為參數的模型(25.7 MPa),這與基于集成嶺回歸后驗分布估計所得的較低不確定性一致。
Wille等人[61]的數據被用作一個小型內部驗證集,包含7種配比,其中包括D50值(110 μm)小于所有訓練數據的細砂,以及D50為5 μm的玻璃微珠。成分變量模型的RMSE為34.0 MPa,而潛在變量模型為43.0 MPa;觀察發現,在成分變量模型的等值線圖中,驗證集樣本點更均勻地分布在45°線附近;而在潛在變量模型中,這些點則明顯位于該線下方。
基于上述分析,成分變量模型似乎具有更高的預測精度。然而,進一步考察圖2b與圖2d所示的校準偏差面積圖可發現:成分變量模型的校準性能顯著劣于潛在變量模型(分別為0.20與0.06)。該區域幾乎完全位于45°線下方,表明模型對不確定性的期望值高于實際觀測到的不確定性,由此可推斷:成分變量模型嚴重低估了由HML底層參數化響應曲面的真實不確定性。
事實上,雖然傳統的RMSE指標顯示成分變量參數化方法適用于優化設計,但校準偏差面積揭示其可能無法準確預測訓練集范圍外的新型高強UHPC配比——因其泛化能力不足。盡管貝葉斯優化(BO)可用于此目的,但我們轉而探索了在Lasso特征選擇后、基于擴展潛在變量集合的GPR方法,旨在提供更具物理解釋性的優化配比方案,以揭示支配UHPC抗壓強度的物理作用力與相互作用機制。
(b) 基于Lasso的特征選擇
模型的中間層初始包含七個特征:等效水泥含量、堆積密度、水膜厚度(WFT)、纖維作用的經驗關系式,以及UHPC配比中的減水劑、水泥和水的質量百分比。在這些主變量基礎上,進一步引入兩兩交叉項(即變量乘積),共生成28個特征。
經十折交叉驗證(圖3a),選定最優正則化參數為 α = 0.008 ,最終特征空間維度縮減至8維,如圖3b的系數圖所示。
圖4展示了Lasso模型的結果,給出了訓練集與測試集的RMSE與 值。盡管基于線性回歸的模型可能不足以精確刻畫響應曲面的非線性形態,但其具備良好的可解釋性——尤其當模型以潛在變量為參數時,優勢更為顯著。
![]()
綜合考慮Lasso分析中訓練集與測試集預測精度的平衡,最終選定的特征集包括以下八項:
等效水泥含量
纖維作用經驗關系式
等效水泥 × 堆積密度(交叉項)
等效水泥 × WFT(交叉項)
堆積密度 × WFT(交叉項)
堆積密度 × 水含量%(交叉項)
減水劑含量% × 水泥含量%(交叉項)
纖維作用經驗關系式 × 水泥含量%(交叉項)

該方程表示一個以這些潛在變量及所選交叉項為自變量的多項式函數,用于描述UHPC抗壓強度的響應曲面。模型假設訓練數據所定義的超曲面是這些變量的線性函數,因此訓練集與測試集的值均相對較低(分別為0.66和0.58)。此處,正系數代表與抗壓強度值呈正相關的變量,而系數的絕對值大小則反映該變量對強度的相對貢獻程度。線性項代表單一潛在變量對抗壓強度的獨立影響,而交叉項——構成模型特征的主要部分——則反映了變量之間復雜的耦合關系。回顧該稀疏模型中的各系數,多數項與已知影響UHPC強度的因素理解一致。例如,“纖維方程”的正系數表明隨著纖維摻量增加,強度提升;而涉及堆積密度的兩個交叉項的正系數也符合設計原則。
涉及“等效水泥”的各項則較為模糊。這些項代表火山灰活性,其線性項以及與堆積密度和WFT相乘的兩個交叉項均具有負系數。對此的一種解釋是:算法正在建模一個有限的參數空間,即在當前研究范圍內,等效水泥含量與其它因素之間可能存在權衡關系——盡管高火山灰活性對于獲得更高強度是必要的,但其可能與其他因素存在抵消作用,例如硅灰、偏高嶺土或纖維替代水泥所帶來的相關性,從而導致此處出現負相關。因此,這些趨勢可能僅在本研究所考察的相對狹窄的等效水泥空間內成立。這也提醒我們,在此類應用中,機器學習主要是一種通過參數范圍內的插值實現設計與優化的工具。
此外,正則化回歸是一種有效的特征選擇方法,但被識別為強度強決定因子的變量可進一步用于更強大的算法中,以更精確地擬合響應曲面并捕捉變量間的相互作用。高斯過程回歸(GPR)正是這樣一種在科學與工程領域廣泛應用的工具,本文亦采用了該方法。
(c) 高斯過程回歸
在GPR中,訓練集數據被用于構建比傳統回歸方法更為穩健的響應曲面模型。回歸方法旨在建立一個函數,使響應曲面上各數據點的預測誤差最小;而GPR則利用數據點之間的相關性來構建模型。這些模型中還有一個額外的超參數——長度尺度(length scale),它決定了相關性計算的空間范圍,允許算法根據長度尺度的大小平滑調整預測(大長度尺度)或在鄰近點間快速變化(小長度尺度)。這種靈活性使GPR能夠建模多種物理系統。
GPR的另一附加優勢在于,算法會自動為每個預測點提供不確定性估計。響應曲面上某些點可能被模型以低方差良好擬合,而其他點則可能具有更高的估計不確定性。由于不同的變量組合——無論是成分變量還是潛在變量——可能導致相似的預測結果,因此即使強度值相近的點也可能表現出截然不同的預測不確定性。盡管GPR背后的數學原理較為復雜,但它為建模復雜物理系統提供了強大工具[86]。本文基于成分變量(底層)和潛在變量(中間層)分別構建了GPR模型,以比較其預測能力及其在優化中的實用性。
底層GPR模型的結果(圖5a,b)與由Lasso確定的最終八特征中間層模型(圖5c,d)如下所示。表5列出了相應的、MSE 和 RMSE 值。值得注意的是,成分變量模型在訓練集與測試集上的準確率值相近(均為0.91),但潛在變量模型的測試準確率略低于訓練值(分別為0.77與0.91)。這表明,基于成分變量的預測對相似配比的預測精度高于基于潛在變量的預測,這一點也在圖5b中更多預測點上較大的誤差棒中得到體現。
![]()
底層與中間層參數化方法在測試集上分別產生了9.6 MPa和15.0 MPa的RMSE。雖然底層回歸模型在RMSE指標上略優于中間層模型(差距略大于5 MPa),但采用中間層參數化方法有助于泛化至具有未測試材料特性的UHPC配比。在高維成分特征空間中訓練時,若僅在模型內部進行插值,則可實現RMSE < 10 MPa。然而,通過采用潛在變量表示法,這一能力可擴展至新型原材料,此時每種配比均可在更均勻分布的空間中表示[87]。這代表了一種簡單的遷移學習形式,適用于原始數據集中未明確包含的配比。
(d) 在驗證集上的泛化性能表現
為展示模型的泛化能力,本文制備并測試了一組全新的三個獨特UHPC配比作為驗證集。所用細骨料粒徑(600 μm vs. 500 μm)不同于訓練集,并使用了不同來源的材料——石灰石。這些配比的比例及實測抗壓強度列于表6。
![]()
這些驗證配比被分別輸入底層與中間層訓練所得的GPR模型,以評估各模型的泛化能力。驗證配比中引入了兩種新材料:D50為600 μm的河砂,以及D50為45 μm的石灰石。
對于基于底層(成分空間特征)訓練的GPR模型,需采用尺寸最接近的材料作為特征代表:
將河砂的成分百分比代入訓練集中代表D50=500 μm砂的特征變量;
將石灰石代入訓練集中代表粒徑11 μm碎石英的特征變量。
而對于中間層表示法,其特征空間由不包含具體粒徑編碼的潛在變量構成。根據驗證集的成分空間,重新計算了顆粒堆積密度、水膜厚度(WFT)、等效水泥含量及纖維關系參數。各模型的預測結果如圖6所示。
盡管底層GPR模型在測試集上表現更優,但在驗證集上其從0.91驟降至?0.06,RMSE則從9.6 MPa大幅上升至28.2 MPa。相比之下,中間層表示法的從0.77小幅下降至0.67,RMSE僅從15.0 MPa微增至15.6 MPa——這一變化趨勢符合預期,即當模型推廣至訓練集與測試集范圍之外時,性能出現合理衰減。對于以中間層參數化的模型,可預期有更高比例的樣本其真實值會落在模型預測的不確定性區間內。
(e) 未來研究方向
用于預測膠凝材料性能的數據類型多樣,其本身固有的不確定性反映了組分變量底層的不確定性。本文所提出的貝葉斯框架可作為高級分析方法的基礎,能夠整合關于水泥、輔助膠凝材料(SCMs)、骨料、纖維及其他組分的多樣化數據,從而優化UHPC等復雜混合物的性能。雖然細骨料的粒徑分布是砂漿與混凝土的重要特性之一,但這僅是可納入該框架的眾多特征之一。隨著更強大的測量工具提供有關顆粒形狀、化學組成、孔結構與結晶度的詳細信息,貝葉斯機器學習可結合現代水泥與混凝土研究中發展出的理論與經驗關系,預測諸如流變性、強度發展及耐久性等復雜行為。
結論
UHPC逆向設計中的一個核心挑戰在于:當使用未經測試的原材料時,模型的泛化能力。即使數據集規模更大,其所涵蓋的潛在材料組分的多樣性仍可能有限,因此必須通過原始數據集之外的驗證實驗來檢驗模型性能。基于從文獻中整合的多種UHPC配方數據,本文采用貝葉斯機器學習方法,比較了以成分變量參數化的模型與以經驗模型相關潛在變量參數化的模型在預測抗壓強度方面的準確性。
![]()
原文鏈接:https://royalsocietypublishing.org/rsta/article/383/2305/20240041/234826/Bayesian-machine-learning-for-inverse-design-of
特別聲明:以上內容(如有圖片或視頻亦包括在內)為自媒體平臺“網易號”用戶上傳并發布,本平臺僅提供信息存儲服務。
Notice: The content above (including the pictures and videos if any) is uploaded and posted by a user of NetEase Hao, which is a social media platform and only provides information storage services.