BOxCrete: A Bayesian Optimization Open-Source AI Model for Concrete Strength Forecasting and MixOpt
一、研究背景与问题现代混凝土配比设计面临多重挑战需要同时满足力学性能、工作性、耐久性和低碳可持续性等多项目标。传统配比设计主要依赖经验试错效率低且成本高。虽然已有研究利用机器学习预测混凝土强度但存在两大瓶颈1缺乏公开、高质量的实验数据集多数为专有工业数据2现有模型大多无法量化预测的不确定性也未能有效捕捉强度随时间的非线性演化规律。二、核心创新与贡献本研究提出了一个名为BOxCrete的开源、概率建模与优化框架核心创新包括开放获取的高质量数据集首次发布了一个来自单一实验室、系统化制备的公开数据集包含123种配比69种砂浆 54种混凝土共533个强度测量值。配比参数覆盖范围广水胶比 0.20–0.50总胶凝材料 240–2150 lb/yd³SCM粉煤灰、矿渣替代率 0–100%。养护龄期1、3、5、14、28天抗压强度范围1 ksi 至 16 ksi隐含碳GWP范围55–535 kg CO₂e/yd³。高斯过程回归模型采用高斯过程GP回归能够输出带95%置信区间的概率预测量化认知不确定性。通过对时间取对数变换结合专门设计的复合核函数时间核 组成-时间联合核成功捕捉了混凝土强度随时间的S形演化规律包括早期快速水化和后期SCM缓慢反应。多目标贝叶斯优化将GP模型与贝叶斯优化BO结合采用预期超体积改进EHVI采集函数实现抗压强度与隐含碳GWP的双目标帕累托优化。能够进行逆向配比设计用户给定强度目标和碳预算模型自动推荐满足要求的配比组成。三、主要结果与性能预测精度最终模型在独立测试集上达到R² 0.94RMSE 0.69 ksi约4.8 MPa显著优于许多基于专有数据集的模型如Pfeiffer等R²≈0.88RMSE≈0.91 ksi。跨五个随机测试集的结果高度一致R² 0.94 ± 0.01RMSE 0.69 ± 0.07 ksi验证了模型的鲁棒性和泛化能力。分阶段学习收敛性模型采用六阶段顺序学习策略随着训练数据多样性的增加预测不确定性从±2.4 ksi早期显著缩小至±0.2–1.3 ksi最终阶段。尤其改善了14天和28天的预测精度这归功于富含SCM的配比数据帮助模型学习到延迟的火山灰反应。逆向设计能力BOxCrete成功生成了满足5000–8000 psi强度要求且GWP低至120–150 kg CO₂e/yd³的配比方案。优化配比实现了 50% 的水泥替代率GWP比传统对照配比降低高达60%同时28天强度超过10 ksi。四、方法论亮点物理一致性约束在t0时刻添加人工零强度观测值确保模型预测符合混凝土浇筑时强度为零的物理事实。不确定性量化后验方差随数据增加而系统性减小提供了模型置信度的统计解释。数据效率仅用约500个数据点即达到优于或媲美数万个数据点训练的专有模型的精度凸显了数据多样性优先于数据量的策略。五、局限性作者明确指出现有工作的两个局限当前模型仅适用于训练集中所用特定来源/类型的材料如特定粉煤灰、矿渣若更换材料源或质量模型可能需要重新校准或迁移学习。目前优化目标仅包含抗压强度和隐含碳GWP尚未纳入工作性和耐久性等现场关键指标。六、结论与意义BOxCrete是首个面向混凝土配比设计的高性能、开源、概率性AI框架提供了完整的实验数据集、训练代码和多目标优化工具。该框架实现了可解释、带不确定性量化的强度预测并支持逆向配比设计可显著加速低碳高性能混凝土的开发。作者以MIT许可证开源全部代码和数据集旨在推动AI在混凝土行业的实际应用并鼓励社区通过数据共享和迁移学习进一步提升模型的通用性。BOxCrete是一个基于高斯过程回归和贝叶斯优化的开源AI框架利用公开的高质量实验数据集能够高精度预测混凝土强度随时间演化的概率分布并在强度和低碳之间进行多目标逆向配比设计为可持续混凝土材料开发提供了一个可重复、可扩展的智能平台。这里是自己的论文阅读记录感兴趣的话可以参考一下如果需要阅读原文的话可以看这里如下所示项目地址在这里如下所示摘要现代混凝土必须同时满足对力学性能、工作性、耐久性和可持续性日益增长的需求这使得配比设计日趋复杂。近期利用人工智能和机器学习模型预测抗压强度并指导配比优化的研究显示出前景但大多数现有工作基于专有工业数据集和闭源实现。本文介绍了BOxCrete——一个开源的概率建模与优化框架该框架基于一个新的开放获取数据集进行训练该数据集包含来自123种配比69种砂浆和54种混凝土在5个养护龄期1、3、5、14和28天测试的500多个强度测量值1-15 ksi。BOxCrete利用高斯过程回归预测强度发展实现了平均R² 0.94和RMSE 0.69 ksi能够量化不确定性并对抗压强度和隐含碳进行多目标优化。该数据集和模型为基于数据驱动的人工智能优化配比设计建立了一个可重复的开源基础。1 引言混凝土是地球上仅次于水的第二大消耗材料年产量估计约为100亿立方米约300亿吨11。其成本最高且CO₂排放最密集的成分——水泥目前年产量为40亿吨22。预计到2050年全球人口将增加25亿社会对住房和公共基础设施的需求将进一步推动水泥和混凝土的生产33。考虑到混凝土成分的规模和复杂性高效的配比设计是优化地球资源利用的关键策略。现代混凝土配比越来越需要同时实现多个目标包括但不限于a) 满足结构性能要求早龄期和晚龄期强度b) 满足特定的耐久性标准低渗透性和体积稳定性c) 满足工作性要求可泵送和现场可浇筑d) 成本效益高以及e) 具有最小的碳足迹44。在过去十年中对最小化碳足迹的日益关注使现代混凝土配比变得更加复杂。具体而言由于1吨波特兰水泥在生产过程中贡献约0.8吨CO₂并占全球人为CO₂排放量的6-8%人们对部分或完全替代这一关键成分产生了浓厚兴趣5−85−8。在这些方法中使用辅助性胶凝材料如粉煤灰和粒化高炉矿渣部分替代水泥是最实用和可行的策略之一9,109,10。此外随着传统辅助性胶凝材料供应变得有限其他辅助性胶凝材料如煅烧粘土、 harvested ashes 和天然火山灰在全球范围内受到越来越多的关注11−1311−13。大多数这些辅助性胶凝材料不仅降低了混凝土的碳足迹和成本还有助于长期性能优势包括增强的后期强度、耐久性和更低的渗透性从而延长混凝土基础设施的使用寿命14,1514,15。然而高辅助性胶凝材料用量存在两个核心问题。首先早期强度和可工作性可能会根据所使用辅助性胶凝材料的质量和数量而受到影响1616。此外含有混合水泥的现代混凝土配比往往加入更多种类的有机外加剂以缓解新型成分带来的挑战17,1817,18。因此这些现代混凝土配比的抗压强度轨迹成为多个配比参数的高度非线性函数19−2219−22。这种高维相互依赖性使得传统的混凝土配比设计在很大程度上是经验性的依赖于耗时且资源密集的试错方法44。混凝土生产本质上是区域化的因为它强烈依赖于当地可获得的胶凝材料、外加剂、骨料和水的可用性、变异性和成本。因此通用的配比方案是不可行的必须根据当地材料的变异性和项目特定的性能目标系统地调整配方。因此越来越需要能够智能地导航这一复杂材料空间的数据驱动配比设计框架并指导开发可持续、低成本的混凝土配比以满足现场的结构、耐久性和工作性要求。机器学习技术越来越多地被探索来解决这一挑战提供了模拟复杂非线性相互作用并直接从配比组成预测性能指标的潜力23−2723−27。先前的研究已将机器学习模型应用于精心整理的实验室数据集和工业预拌记录以预测抗压强度。根据现有文献存在两个主要的研究空白。首先Yeh19982323的原始数据集包含约1000个测量值已有近30年历史此后在单个实验室中再也没有获得新的公开数据集。最近关于大型工业数据集的研究Young等人1919约1万个测量值Pfeiffer等人2828约4万个测量值很有前景但无法公开获取。其次大多数现有方法忽略了强度发展的概率性和随时间演变的特性并且未能量化不确定性而这对于早期和后期强度同等重要的鲁棒性结构应用至关重要28,2928,29。为了填补这些空白迫切需要公开的高保真数据集和能够随时间预测强度并量化相关不确定性的开源AI模型。在本研究中我们介绍了BOxCrete——一个新颖的、开源的建模与优化框架该框架基于533个独特的强度测量值进行训练我们将其作为开放获取的公共数据集发布。这533个测量值对应于在单个实验室伊利诺伊大学制备的123种实验浇筑的砂浆69种和混凝土54种配比这些配比具有系统变化的水胶比、胶凝材料含量和辅助性胶凝材料替代水平如图1所示。BOxCrete AI模型利用高斯过程回归3030将强度发展建模为时间和配比组成的函数概率模型图1BOxCrete用于可持续混凝土配比优化的AI在环框架。原材料IL型水泥、辅助性胶凝材料和骨料按比例配制成砂浆和混凝土配比浇筑成型并在1、3、5、14和28天测试抗压强度。通过生命周期评估量化从摇篮到大门的总增温潜势。将得到的配比组成、强度和总增温潜势数据集用于训练高斯过程回归模型以预测强度演变并量化不确定性。结合贝叶斯优化训练好的模型生成针对用户定义的强度和可持续性目标的新配比设计。AI建议的配方经过实验验证并重新引入循环实现自适应学习加速发现用于基础设施应用的高性能、可持续混凝土。从而实现跨多个养护龄期的带不确定性感知的预测2929。为了加速材料设计我们将此框架与贝叶斯优化3131相结合进行抗压强度和总增温潜势的多目标优化32,3332,33从而能够快速识别最优的胶凝材料配方。该模型通过六个实验阶段第一阶段至第六阶段迭代优化每个阶段都整合了日益多样化的数据并针对从训练集中排除的12种独立混凝土配比进行了验证。最终模型在所有养护龄期实现了R²为0.94RMSE 0.70 ksi显示出高预测精度和强泛化能力。最后BOxCrete还使得开发28天抗压强度超过6 ksi、同时隐含碳水平低至120–150 kg CO₂e/yd³的混凝土配比成为可能强调了其长期同时优化性能和可持续性的能力。完整的数据集和AI模型将作为开放获取资源发布以促进社区驱动的改进和更广泛的适用性。这个结合了开源AI框架和精心整理的实验数据集降低了AI采纳的门槛同时加速了跨不同材料系统的高性能、低碳混凝土配方的发现。通过将实验精度与统计可解释的机器学习相结合BOxCrete为混凝土配比设计中的多目标优化建立了一个可扩展的框架推动了可持续、高性能建筑材料的发展。结果与讨论实验配比的强度与可持续性理解力学性能与隐含碳可持续性之间的耦合关系对于推进可持续胶凝材料设计策略至关重要。先前的研究表明优化利用辅助性胶凝材料如粉煤灰和矿渣可以通过互补的水化机制在强度发展和CO₂减排之间取得平衡5,345,34。因此为了建立一个全面的预测框架有必要表征抗压强度和总增温潜势如何在组成多样化的胶凝材料空间中演变。这构成了本研究的基础为后续的模型开发提供了机理和统计基础。图2展示了123种独特胶凝材料配比的抗压强度和相应的总增温潜势值包括69种砂浆和54种混凝土配比。图2a中的每个子图对应一个离散的水化龄期1、3、5、14和28天展示了在广泛的设计空间中力学性能和隐含碳随时间的演变。图2b进一步展示了所有配比的抗压强度随养护龄期的演变突出了数据集中捕获的高度异质、非线性的强度发展轨迹。这个开放获取的数据集涵盖了广泛的配比组成变化包括水胶比从0.20到0.50总胶凝材料含量从240到2150 lb/yd³以及不同比例的辅助性胶凝材料如粉煤灰和矿渣。这种多样性使得抗压强度范围从低于1 ksi到高达16 ksi6.9-110 MPa总增温潜势值范围从55到535 kg CO₂e/yd³。在水化早期1-5天图2a抗压强度的增加通常与较高的总增温潜势相关特别是在普通硅酸盐水泥含量较高的配比中。这种相关性源于阿利特C₃S的快速水化动力学它驱动了C-S-H和氢氧化钙的早期成核与生长3535。这一早期阶段的强度增益主要由初级水化产物主导反应程度与水泥含量强相关3636。因此高早期强度通常是以更高的熟料用量和相关的CO₂排放为代价实现的。相对于混凝土砂浆系统倾向于聚集在较高的总增温潜势水平因为缺少骨料的稀释作用导致单位体积混合料中的胶凝材料体积更大。到28天时图2a强度与总增温潜势的关系变得非单调。几个总增温潜势值在100到200 kg CO₂e/yd³之间的配比达到了10到16 ksi的抗压强度。这种转变反映了辅助性胶凝材料的活化它们通过火山灰反应粉煤灰和潜在水硬反应矿渣驱动的二次C-S-H形成来贡献强度34,37,3834,37,38。这些反应比普通硅酸盐水泥水化进展更慢但随着养护时间的增加变得日益显著。随着水化进行混合体系表现出更高的反应程度、更致密的微观结构和更精细的孔径分布通常产生的强度可与高水泥含量的对照配比相当或超过3939。此外由于粗细骨料的稀释效应占据了体积空间而不贡献与胶凝材料相关的排放混凝土混合料在所有龄期都表现出比砂浆更低的总增温潜势值。总体而言结果表明强度发展对配比组成高度敏感但通过平衡的胶凝材料设计可以同时实现低隐含碳。这凸显了描绘潜在组成设计空间的必要性强调了单个配比参数在控制力学性能和可持续性方面的关键作用。与以往通常报告28天强度为3-7 ksi、总增温潜势值为240-450 kg CO₂e/yd³的研究相比本数据集涵盖了更广泛的领域——强度高达16 ksi总增温潜势值范围约为55至535 kg CO₂e/yd³。跨水化龄期数据集揭示了在强度-总增温潜势空间的右上象限此处定义为优化目标内高性能、低碳混合料的密度不断增加。这些混合料反映了降低熟料含量和增强辅助性胶凝材料反应性的有效平衡。强度-总增温潜势曲线随养护时间的动态演变强调了时间依赖性配比优化的重要性以及机器学习框架在指导可持续、高性能混凝土混合料规定性设计中的潜在作用。图2砂浆和混凝土混合料跨养护龄期的抗压强度与隐含碳演变。对于69种砂浆圆形和54种混凝土三角形混合料在养护1、3、5、14和28天绘制了总增温潜势与无侧限抗压强度的关系图。每个数据点代表一种独特的配比设计具有变化的胶凝材料含量240-2150 lb/yd³、水胶比0.20-0.50以及使用C级和F级粉煤灰、粒化高炉矿渣对波特兰石灰石水泥的不同替代水平。垂直误差线表示基于三个平行试件的抗压强度测量值的标准误差。总增温潜势值使用标准材料排放因子在从摇篮到大门的基础上计算。优化性能区由低隐含碳和高抗压强度定义对应于每个图的右上象限。预测抗压强度的时间演变预测胶凝材料体系中抗压强度的时间演变需要能够准确表征水化动力学、胶凝材料化学和体积配比组成之间非线性耦合关系的模型。传统的经验和基于神经网络的方法已被证明可用于预测单龄期强度19,2319,23但当扩展到连续的强度发展轨迹时它们往往缺乏泛化能力和可解释性。为了解决这些限制本研究采用高斯过程回归框架该框架能够捕捉时间依赖的水化行为同时量化预测不确定性。本节评估了模型的分阶段学习进展及其在跨多样化配比设计中再现实验强度曲线的能力。在本研究中AI模型通过跨六个混合料开发阶段第一阶段至第六阶段逐步增强数据集而进行训练和优化。最终的、完全训练好的模型第六阶段随后被用于预测一组留出的12种混凝土混合料的抗压强度发展曲线。该验证集是随机选择的未包含在训练数据中。为了进一步评估模型的鲁棒性在五次随机迭代中构建了五个不同的测试集测试集1-5。这些测试集中12种混凝土混合料的组成变化在图S3中进行了图形化总结。图3显示了对于测试集1中的六种代表性混凝土混合料图A模型预测能力随训练阶段第一阶段至第六阶段的进展比较了跨1-28天养护龄期的预测抗压强度值与实验测量值。这些阶段对应于逐渐增大的训练数据集从小的初始子集第一阶段到完整的混凝土数据集第六阶段并用于逐步校准AI模型见表2。预测的强度曲线蓝线包括95%置信区间阴影区域±2个标准差而实验测量值绘制为离散点误差线表示±1个标准差n3。测试集1中其余混合料以及测试集2-5的相应比较显示在补充信息的图S4中。模型成功地再现了所有混合料表现出的特征性S形强度演变行为可靠地捕捉了水泥水化的多相动力学。特别是模型捕捉了在1-5天之间观察到的快速早期强度增长以及后期14-28天逐渐稳定的强度增加。由于实验测量是在强度发展的多个关键时间点1、3、5、14和28天收集的高斯过程回归模型能够学习与早期初级水化和后期辅助性胶凝材料驱动反应相关的细微差别。这种跨多样化混合料组成在所有测试集中的一致性吻合证明了模型能够直接从组成和时间数据中推断潜在的水化动力学而无需依赖经验曲线拟合参数。模型精度随着训练数据集的大小和组成多样性的增加而系统性地提高这反映在图3中各阶段阴影不确定性边界的逐渐收缩。在早期学习阶段第一阶段-第二阶段预测区间相对较宽28天时约为±0.8-2.4 ksi特别是对于具有独特胶凝材料化学性质或较高水胶比的混合料。这种分散性表明由于模型对多样化水化途径的接触有限导致预测不确定性较高。随着在第三至第五阶段纳入更多配方阴影不确定性区域显著缩小至±0.4-1.9 ksi并且预测平均值在所有养护龄期都显示出与实验观察结果更好的对齐。到第六阶段对于大多数数据点不确定性包络线收缩到约±0.2-1.3 ksi以内预测强度和测量强度显示出近乎一致的关联性R² ≈ 0.94RMSE ≈ 0.73 ksi。值得注意的是模型不仅捕捉了总体强度趋势还捕捉了由于混合料参数变化引起的强度差异。例如水胶比较低0.25的混合料C5其1天和3天强度分别达到约2.2 ksi和6 ksi而水胶比较高0.35的混合料C15其早期强度较低分别约为0.71 ksi和3.2 ksi。不断增加的数据密度和组成多样性使模型能够更好地学习非线性水化相互作用减少了在中间龄期3-14天的偏差而早期阶段在这些龄期表现出轻微低估。重要的是这种单调的改进和收敛模式在所有五个独立的测试迭代测试集1-5中一致观察到强调了顺序学习框架的可重复性和鲁棒性。与先前基于AI的模型通常报告的R²值在0.49到0.89之间RMSE值接近0.75 ksi19,23,2819,23,28见表S11相比本研究的GP回归框架在开放获取数据集上实现了显著更高的精度R² ≈ 0.94RMSE 0.69 ksi同时通过其概率公式和显式的不确定性量化保持了可解释性。分阶段学习策略能够有效表征非线性水化行为使模型能够逐步区分以熟料为主导的早期反应和以辅助性胶凝材料驱动的火山灰贡献这些贡献决定了后期的强度演变。随着数据集的丰富不确定性边界的适应性收缩定量地反映了跨养护龄期 epistemic 置信度和泛化能力的提高。总体而言精炼后的模型为跨多样化的胶凝材料化学体系进行时间相关强度预测提供了统计上稳健且可解释的基础构成了数据驱动优化可持续混凝土系统的关键基础。图3AI模型抗压强度预测随训练数据集大小的演变。对于六种代表性混凝土混合料跨六个训练数据集阶段第一阶段至第六阶段显示了预测的蓝线和实验测量的绿点抗压强度。每个阶段对应于扩展的训练集大小包含了具有不同胶凝材料组成和水胶比的越来越多的配比设计。阴影区域表示模型预测的95%置信区间均值±2个标准差。实验数据点表示三次平行测试的均值±1个标准差n3。该图展示了随着训练集变得更加全面模型精度和不确定性减少的逐步改进。预测强度建模中精度与不确定性的分阶段收敛BOxCrete模型的预测能力通过一个系统的分阶段学习框架进行了进一步评估该框架旨在量化精度和不确定性如何随着数据的逐步丰富而演变。这种方法提供了模型收敛行为的统计解释将组成多样性的整合与跨养护龄期预测精度的可测量改进联系起来。图4展示了BOxCrete模型在六个顺序训练阶段P-I到P-VI预测精度的逐步演变证明了性能如何随着纳入日益多样化的混合料组成而提高。主 parity 图左比较了最终训练阶段P-VI所有12种混凝土混合料的实验测量和预测的抗压强度达到了R² 0.94和RMSE 0.73 ksi。标记形状对应于养护龄期1、3、5、14和28天而颜色梯度表示阶段进展。数据点沿着1:1线强聚类以及狭窄的分散包络线反映了在宽强度范围内出色的预测保真度和泛化能力。分阶段 parity 图右捕捉了从P-I到P-VI预测性能的转变。在早期阶段P-I和P-II明显的更宽分散和系统性低估是明显的特别是对于超过6 ksi的混合料这是由于对富含辅助性胶凝材料或高强度组成的代表性有限。随着数据的逐步增加阶段P-III到P-Vparity线周围的分散收缩最佳拟合线的斜率趋近于1。到阶段VI阴影不确定性带从早期阶段的约±2.4 ksi缩小到约±0.2 ksi预测强度和测量强度沿着1:1参考线紧密对齐表明系统性偏差几乎完全消除。累积面板P-I到P-VI进一步强化了这种收敛行为证明了性能在再训练周期中持续改进。下面面板中的定量指标加强了这些观察结果。决定系数R²和均方根误差被绘制为每个养护龄期阶段数的函数见表S6-S10。两个指标都随着阶段进展表现出系统性的增强——R²从第一阶段的约0增加到第六阶段的0.94RMSE从约5.5 ksi降低到0.73 ksi。不确定性包络线的收缩反映了 epistemic 误差的一致减少模型在吸收先前未见的组成领域时获得了统计置信度。最显著的改进发生在较晚的龄期14和28天其中富含辅助性胶凝材料的组成的纳入使得能够更好地模拟延迟的火山灰和潜在水硬反应。相比之下早期预测1-3天主要受阿利特水化和外加剂效应控制显示出较小的相对改进这与早期水化过程的较低组成敏感性一致。在所有五个测试迭代数据集2-5中均观察到R²和RMSE的类似改进如补充信息图S5所示。每个测试集跨阶段R²和RMSE改进的总结提供在图S6和S7中。所有五个测试数据集的RMSE一致收敛——从超过3000 psi的初始值到第六阶段低于1000 psi——证明了模型有效学习组成-强度关系并泛化到未见配方的能力。第六阶段后收敛的R²和RMSE值总结在表1中。本研究实现的预测精度R² 0.94RMSE 0.69 ksi与胶凝材料体系强度预测模型的既定基准相当并且在某些方面超过了它们。Pfeiffer等人20242828使用在9,296个工业混凝土混合料的私有数据集上训练的高斯过程回归模型报告了R² ≈ 0.88RMSE ≈ 0.91 ksi见表S11。值得注意的是BOxCrete以少近两个数量级的数据点实现了相似或更好的精度凸显了其数据效率。这种改进源于有意的组成多样化和分阶段训练策略这些策略共同实现了对混合料参数与抗压强度之间高维非线性关系的鲁棒学习。类似地Young等人20191919分析了超过10,000个现场收集的混合料报告了R² ≈ 0.60 ± 0.05和RMSE 0.64-0.72 ksi尽管他们的数据集和模型是专有的。在产生相似RMSE值的同时BOxCrete提供了一个关键优势其数据集和代码是完全开放获取的实现了超越专有实现的可重复性、透明度和可扩展性。最后Yeh19982323早期的ANN框架对1,030个强度测量值实现了R² ≈ 0.88但缺乏对现代混凝土混合料进行可泛化预测所需的组成多样性。总的来说这些结果表明优先考虑数据多样性而非数据量的顺序学习显著增强了预测精度和可解释性。高斯过程回归框架不仅捕捉了时间依赖的强度演变还量化了不确定性的减少将统计收敛与物理水化机制联系起来。这种分阶段学习范式为开发用于可持续混凝土设计的高精度、物理可解释的AI模型建立了一条可重复且数据高效的路径。表1BOxCrete模型跨测试数据集和养护龄期的性能指标。展示了在五个独立测试集上对于1、3、5、14和28天养护龄期以决定系数R²和均方根误差RMSE衡量的统计性能。全局平均值为R² 0.94 ± 0.01RMSE 0.69 ± 0.07 ksi。指标龄期测试集1测试集2测试集3测试集4测试集5所有测试集R²1天0.670.940.860.860.670.80 ± 0.123天0.690.820.820.860.690.78 ± 0.085天0.830.830.860.820.830.83 ± 0.0214天0.920.850.870.930.920.90 ± 0.0428天0.910.840.840.930.910.89 ± 0.04所有龄期0.940.940.930.940.960.94 ± 0.01RMSE (ksi)1天0.590.350.550.640.590.54 ± 0.113天0.770.660.740.760.770.74 ± 0.055天0.730.700.710.960.730.77 ± 0.1114天0.700.700.710.650.700.69 ± 0.0228天0.850.840.840.710.850.82 ± 0.06所有龄期0.730.670.720.750.580.69 ± 0.07图4BOxCrete预测精度在测试集1上的分阶段改进。模型性能在六个训练阶段P-I到P-VI中展示使用了来自123种砂浆和混凝土混合料在1、3、5、14和28天评估的抗压强度数据。左图最终阶段P-VI的parity图比较了n60个独立测试样本的预测强度与实验强度R² 0.94RMSE 0.73 ksi。标记形状表示养护龄期误差线表示±1个标准差总跨度2σ。与1:1线的强对齐表明跨水化阶段的高预测精度。右图特定阶段的parity图P-I到P-VI和汇总面板P-I到VI显示了分散和偏差的逐步减少早期阶段低估了高强度混合料后期阶段紧密收敛到parity。底部每个养护龄期的R²和RMSE随阶段迭代的演变显示出一致的改进最大的增益出现在14天和28天这是由于更好地表征了辅助性胶凝材料驱动的延迟水化反应。BOxCrete用于混凝土的逆向配比设计除了正向预测BOxCrete框架还能够基于用户定义的抗压强度和总增温潜势约束对混凝土混合料进行逆向设计。这一能力对于旨在满足结构性能要求同时最小化早期配比设计中隐含碳的从业者尤其相关。为了演示此功能BOxCrete被用于生成候选混合料这些混合料在50 kg CO₂e/m³的总增温潜势区间内满足5000、6000、7000和8000 psi的最小抗压强度阈值。对于每个总增温潜势区间模型返回一组50个可行的配比设计。图S8展示了小提琴图显示了关键混合料参数包括水泥、粉煤灰、矿渣、水胶比和高范围减水剂用量在不同总增温潜势区间和强度水平下的分布。随着强度要求的增加模型逐步缩小了可行设计窗口特别是在允许的水胶比和总胶凝材料含量方面反映了与更高强度相关的更严格的力学约束。在较低的总增温潜势水平下模型倾向于富含辅助性胶凝材料的配方特别是那些含有更高矿渣含量和更高高范围减水剂用量的配方这些在补偿降低的水泥用量的同时保持了足够的工作性和性能。图S9显示了由此产生的组成设计空间展示了胶凝材料含量、水胶比以及辅助性胶凝材料替代水平如何相互作用以满足指定的28天强度目标。这些混合料代表了模型为满足用户指定的强度和可持续性约束而探索的解空间。除了点对点的强度-碳权衡逆向设计框架还允许用户规定完整的强度发展曲线——包括随时间变化的目标S形曲线——并获得相应的混合料组成。通过将时间演变整合到设计过程中BOxCrete实现了性能驱动的混凝土混合料定制这些混合料在定义的可持续性标准下满足早期和长期强度要求。这扩展了该框架在現代低碳建筑中用于定制化、规范驱动的配比设计的适用性。局限性与未来展望尽管我们的开源AI模型在我们的开放获取公共数据集包含500个独特强度测量值上表现出强大的预测性能R² 0.94RMSE 0.69 ksi但这项工作存在两个关键局限性。首先当前数据集主要侧重于改变有限类型成分的体积比例。改变成分如辅助性胶凝材料或化学外加剂的性质、来源和质量将显著影响混凝土性能。因此当前训练好的模型可能无法很好地适用于与训练集中使用的材料不同的其他材料。也就是说这种开源方法标志着朝着开发更通用模型迈出的第一步该模型可以通过考虑化学例如反应性和物理例如粒径分布性质来解释各种成分的质量。鉴于我们工作的开放获取性质我们邀请混凝土研究界在这一初始数据集的基础上继续努力争取开发出更通用的混凝土性能预测模型。其次当前模型主要考虑力学性能抗压强度和可持续性总增温潜势作为关键优化参数。然而对于现场性能很重要的另外两个参数——工作性和耐久性——目前未被考虑。鉴于我们最初关注的是强度发展曲线这些被认为超出范围。未来的研究应考虑优化和预测所有参数以完全实现针对任何项目特定标准的鲁棒逆向配比设计。尽管存在这些局限性我们乐观地认为这项研究为在开放获取数据集上开发和部署用于混凝土性能预测和配比设计的开源AI模型开辟了一条新途径。特别是通过提供MIT许可证下的开源仓库我们希望鼓励在商业软件中实施AI这些软件可供混凝土供应商、材料供应商以及整个建筑行业使用以加速使用标准和新型材料发现高性能、可持续的混凝土配比。结论现代混凝土是多种成分的复杂混合物——所有这些成分对最终混合料性能都有非线性影响。鉴于人们对优化和设计混凝土混合料以实现力学性能、可持续性、工作性和耐久性等多目标的兴趣日益增长迫切需要开发基于人工智能/机器学习的方法。本研究介绍了BOxCrete一个开放获取的机器学习框架旨在预测和优化具有高辅助性胶凝材料含量的混凝土混合料的抗压强度和环境性能。BOxCrete在一个系统化整理的数据集包含123种独特混合料69种砂浆和54种混凝土混合料上进行训练能够对平衡性能和可持续性的混合料设计进行多目标优化。我们从本研究中得出四个关键结论。首先基于高斯过程的模型在早期和晚期养护龄期均表现出高预测精度28天时R²超过0.90并达到0.94RMSE为0.69 ksi。这种改进强调了模型捕捉粉煤灰和矿渣等辅助性胶凝材料延迟反应性的能力。其次将BOxCrete与贝叶斯优化相结合可以识别出28天抗压强度超过10 ksi、同时保持总增温潜势在150-200 kg CO₂e/m³之间的配方。这些优化的混合料实现了50%的水泥替代率总增温潜势比等效对照混合料降低高达60%。第三模型的概率架构实现了可解释的、具有不确定性意识的预测使决策者能够量化置信水平、优先安排数据收集并有效地探索强度-可持续性之间的权衡。最后更广泛的数据多样性和标准化的报告对于在全球范围内扩展BOxCrete至关重要。整合区域数据集并采用迁移学习将增强跨可变辅助性胶凝材料化学性质和当地材料供应的适应性。BOxCrete为人工智能辅助的可持续混凝土设计建立了一个可重复且可扩展的框架加速了向低碳基础设施的进展。实验方法用于时间相关强度预测的机器学习框架高斯过程从数据中学习高斯过程是一种基于复杂和噪声先验数据对函数进行建模的非参数化方法3030并已在包括BoTorch4040和GPyTorch4141在内的框架中实现。与返回单一的确定性结果不同GP提供了在给定观测输入-输出对的条件下可能输出的后验预测分布。GP定义了函数上的分布其特征是函数值的任何有限集合都遵循联合高斯分布3030。虽然多元高斯分布对有限维向量上的概率分布进行建模但GP对函数上的分布进行建模。形式上GP由均值函数μ m(X)和协方差核函数Σ k(X, X)定义。给定一组输入点 X [x₁, x₂, ..., xₙ]相关的函数值联合分布为f ~ N(μ, Σ) (1)其中 f f(X) [f(x₁), f(x₂), ..., f(xₙ)]μ m(X) [m(x₁), ..., m(xₙ)]协方差矩阵定义为 Σ_ij k(x_i, x_j)。当 X X 时该矩阵是半正定的。GP回归的主要目标是根据观测到的训练输出 y 预测新输入 X* 处的未知函数值 f*。假设观测噪声 ε ~ N(0, σ_n² I)训练观测值建模为 y f ε。带噪训练观测值 y 和潜在测试输出 f* 的联合分布为[ y; f* ] ~ N( [μ; μ], [ Σ σ_n² I, Σ_^T; Σ_*, Σ_** ] ) (2)其中 Σ k(X, X)Σ_* k(X, X)Σ_** k(X, X)。给定训练数据f的条件分布后验为f* | y ~ N( μ* Σ_*^T (Σ σ_n² I)^{-1} (y - μ), Σ_** - Σ_*^T (Σ σ_n² I)^{-1} Σ_* ) (3)对于数据集 D (X, y)后验GP可以写为 f|D ~ GP(m_D, k_D) (4)其后验均值为 m_D(x) m(x) k(X, x)^T (Σ σ_n² I)^{-1} (y - m(X)) (5)后验协方差为 k_D(x, x) k(x, x) - k(X, x)^T (Σ σ_n² I)^{-1} k(X, x) (6)。后验方差相对于先验方差总是减少的因为它纳入了观测数据从而减少了认知不确定性。多目标贝叶斯优化在训练和验证了GP模型之后就可以使用贝叶斯优化3131来识别能够实现所需输出属性的输入变量其在航空航天工程4242、生物学与医学4343、土木工程2929、机器学习超参数优化44,4544,45和材料科学4646中都有应用。GP-BO框架提供了实现目标结果的概率估计从而减少了所需的实验试验次数。在现实世界应用中许多设计任务涉及多个竞争目标m 1称为多目标优化。这些目标可以表示为 f(x) [f₁(x), f₂(x), ..., f_m(x)] (7)。由于这些目标通常会相互权衡因此通常不存在能够同时优化所有m个目标的单一解。相反目标是表征最优权衡集即帕累托前沿。为了评估候选帕累托集的质量定义了一个参考点 r [r₁, r₂, ..., r_m]其中 r_i 是第 i 个目标的最小可接受阈值。一个广泛用于评估帕累托集质量的指标是超体积它测量目标空间中由帕累托集 P {y_i}{i1}^k 支配且以参考点 r 为边界的 m 维体积。形式上HV(P, r) λ(∪{y_i∈P} [r, y_i]) (8)其中 λ 表示勒贝格测度[r, y_i] 表示 r 和点 y_i 之间跨越的超矩形。为了在BO中优化超体积增益常用的采集函数是预期超体积改进EHVI(x) E[ (HV(P ∪ {f(x)}, r) - HV(P, r)) ] (9)其中 (·) 表示截断为零。该量度量了评估新候选点 x 所导致的预期超体积增加。当同时评估一批 q 个点时目标向量变为 F(X) [f(x₁), ..., f(x_q)] (10)。在这种情况下由于在更高维度中计算超体积的计算复杂性通常采用蒙特卡洛方法来估计EHVI3232。在这项工作中我们使用 qLogEHVI 采集函数3333它以数值稳定的方式计算对数变换后的EHVI目标产生改进的数值性质并实现了最先进的多目标优化性能甚至优于基于熵搜索的方法。多目标贝叶斯优化——将高斯过程回归与EHVI相结合——有效地平衡了探索和利用使得能够在高维设计空间中发现高性能的权衡方案。模型架构我们详细介绍了Ament等人20232929最初提出的模型。鉴于传统机器学习模型的局限性我们使用了一个概率模型 strength(x, t)该模型联合捕捉了抗压强度对混合料组成 x 和时间 t 的依赖性。为了强制执行混凝土在浇筑时刻强度为零的物理条件对于观测到的和随机选择的未观测组成添加了 t 0 处的人工零强度观测值。由于强度发展是高度非线性的——早期快速增长后期趋于平稳——对时间输入应用对数变换 t → log t。这使得能够使用平稳核并提高预测性能2828。该模型的核结合了一个与组成无关、与时间相关的分量 k_time 和一个关于组成和时间的联合核 k_joint得到复合核k((x,t), (x,t)) α k_time(log t, log t) β k_joint((x, log t), (x, log t)) (11)其中 α, β 0 是通过边际似然优化学习的方差参数3030。对于 k_time 使用指数二次核而对于 k_joint 使用带有自动相关性确定的 Matern 5/2 核。这种结构允许模型学习一般的强度发展模式同时保持对混合料间组成变化的敏感性。模型性能评估训练好的GP模型的预测性能使用两个指标进行评估决定系数R²和均方根误差RMSE。R²值衡量自变量解释因变量方差的程度值越接近1.0表示模型一致性越好若为负则报告为0。RMSE量化了预测值与观测值之间绝对误差的平均幅度。R²和RMSE的表达式为R² 1 - Σ(y_i - ŷ_i)² / Σ(y_i - ȳ)²RMSE √(1/N Σ(y_i - ŷ_i)²) (12)其中y_i 表示观测输出ŷ_i 表示预测输出ȳ 是观测输出的均值N 是观测总数。材料与实验方法材料本研究中使用的材料采购自商业供应商。波特兰石灰石水泥用作主要胶凝材料。C级粉煤灰包括C1和C27天R3放热量316 J/g、F级粉煤灰F17天R3放热量209 J/g以及Grade 100矿渣包括S1、S2和S37天R3放热量488 J/g被用作辅助性胶凝材料以部分替代PLC。胶凝材料的化学成分使用X射线荧光根据ASTM D4326-134747进行量化并报告在补充信息中。使用激光衍射仪获得胶凝材料的粒径分布结果展示在补充材料中。混合料开发混合料开发遵循一个闭环实验设计框架图1结合了迭代实验室优化和基于GP的模型精炼。实验数据集包含123种独特配方69种砂浆混合料和54种混凝土混合料分六个顺序阶段开发。每个阶段系统地扩展了胶凝材料组成、水胶比、水泥替代水平、高范围减水剂用量和养护温度的参数空间——这些都是影响水化动力学、强度发展和环境影响的关键参数。数据集1的混合料设计组成范围总结在表2中数据集2-5的训练混合料总结在补充信息的表S2-S5中。图5图形化地总结了实验数据集的组成变异性及其对抗压强度的影响。上面面板中的散点图描绘了28天抗压强度如何随单个混合料参数包括水泥、粉煤灰、矿渣、骨料级分、高范围减水剂用量、浆体含量、辅助性胶凝材料替代水平和水胶比变化。每个子图呈现了不同的性能趋势胶凝材料含量的增加和水胶比的降低通常产生更高的强度而较高的辅助性胶凝材料含量或较高的高范围减水剂用量由于火山灰反应性和化学分散效率的差异而引入了变异性。下面面板中的三元图代表了胶凝材料组成空间——水泥、粉煤灰和矿渣——并按1、5和28天的抗压强度着色。颜色梯度展示了强度随水化龄期的演变突显了从熟料主导的早期强度1天到辅助性胶凝材料活化的后期性能28天的转变。这些可视化共同展示了水泥和辅助性胶凝材料比例如何共同决定跨养护阶段的强度发展轨迹。数据集构建从第一阶段开始该阶段侧重于砂浆规模实验以探索广泛的参数范围第一阶段专注于砂浆混合料n69具有广泛的胶凝材料含量240-2150 lb/yd³、水胶比0.20-0.50、水泥替代水平0-100%、高范围减水剂用量0-22.5 lb/yd³和养护温度4.5-22°C。第二阶段通过调整细骨料与粗骨料的比例0.3-0.9将有前景的砂浆配方按比例放大到混凝土。第三阶段通过修改水泥替代水平最高80%、水胶比0.30-0.40和高范围减水剂用量0-3 lb/yd³来精炼按比例放大的混凝土混合料然后将其重新引入数据集。第四阶段通过改变胶凝材料含量675-1125 lb/yd³、水胶比0.35-0.50、辅助性胶凝材料用量0-80%和高范围减水剂用量0-1.3 lb/yd³来扩展设计空间。第五阶段利用与多目标贝叶斯优化集成的GP模型生成新的混凝土配方这些配方针对低总增温潜势和高强度进行了优化。这些AI推荐的混合料具有胶凝材料含量625-755 lb/yd³、水泥替代水平29-60%和高范围减水剂含量2.2-3.4 lb/yd³的特点。经过实验验证后这些混合料被纳入训练集。第六阶段通过进一步调整胶凝材料含量440-760 lb/yd³、水泥替代水平29-52%、水胶比0.39-0.50、高范围减水剂用量0-3.4 lb/yd³和养护温度10-22°C来微调最有前景的AI生成配方以增强模型鲁棒性。对于模型评估数据集被分为80%的训练集和20%的测试集。通过比较GP模型在测试集上的预测值与实验测量的强度来评估预测性能。表2用于模型训练和验证的混合料组成摘要阶段混合料数量类型修改的参数I69 (M1-M69)砂浆胶凝材料含量水胶比水泥替代率高范围减水剂用量养护温度II7 (C1-C4, C6-C8)混凝土细骨料与粗骨料比例III5 (C10-C14)混凝土辅助性胶凝材料用量水胶比高范围减水剂含量IV10 (C16-C20, C22-C25)混凝土胶凝材料含量水胶比辅助性胶凝材料用量高范围减水剂含量V4 (C28-C31)混凝土胶凝材料含量水泥替代率高范围减水剂含量VI16 (C33-C53)混凝土胶凝材料含量水泥替代率水胶比高范围减水剂用量养护温度图5组成多样性和胶凝材料协同作用控制强度发展。散点图显示了所有砂浆和混凝土混合料的分布将28天抗压强度与关键混合料参数包括水泥、粉煤灰、矿渣、骨料、高范围减水剂用量、浆体含量、辅助性胶凝材料替代率和水胶比联系起来。宽广的、非单调的趋势反映了有意设计的高熟料和低熟料系统的多样化设计空间构成了稳健模型训练的基础。三元图描绘了1、5和28天时的胶凝材料相分布水泥-矿渣-粉煤灰强度由连续颜色梯度表示。早期强度集中在富含水泥的组成中而后期高强度区域转向平衡的三元混合料突显了辅助性胶凝材料的逐步活化和协同水化效应。抗压强度测试抗压强度针对砂浆和混凝土试件进行测定。砂浆立方体2×2英寸按照ASTM C1094848进行测试而混凝土圆柱体4×8英寸按照ASTM C394949制备和测试。砂浆样品在四个龄期1、3、5和28天进行测试而混凝土样品在五个龄期1、3、5、14和28天进行测试。1天测试在脱模后立即进行所有试件随后储存在维持98%相对湿度的养护室中直到指定的测试龄期。总增温潜势评估开发的混凝土混合料的总增温潜势采用以下表达式在从摇篮到大门的基础上进行评估GWP(z_i) g_mᵀ z_i g_tᵀ z_i g_pᵀ z_i (14)其中 g_m、g_t 和 g_p 分别表示与原材料生产、运输和混凝土生产相关的温室气体排放。向量 z_i 表示混合料 i 中每种成分的用量28,5028,50。GWP计算使用OpenConcrete进行这是一种采用基于过程的LCA方法的在线生命周期评估工具。该工具模拟混凝土生产每个阶段的排放——包括原材料提取、研磨以及运输到搅拌站。补充图S1说明了主要混凝土成分的生命周期阶段。OpenConcrete允许用户指定自定义的混合料组成、运输距离和区域能源结构从而实现上下文敏感的影响估算。为了确保一致性和可比性所有GWP值都归一化到每立方米混凝土49。