Bayesian estimation of resilient modulus of Jiangsu soft soils from sparse data—Gaussian process regression and cone penetration test data-based modelling and analysis
-
摘要: 利用已有的江苏软土路基的土体参数数据集,构建了基于高斯过程回归的软土回弹模量数学模型。该模型在给定江苏软土路基静力触探试验数据(如锥尖阻力、侧摩阻力)以及软土含水率、干重度条件下,可以合理地预测江苏软土路基的回弹模量。由于该模型由贝叶斯框架出发,因此可以同时确定模型预测的不确定性。与传统的机器学习方法相比,该模型具有较强的解译性,能够准确地反映出回弹模量与不同土体参数间的依赖关系强弱。此外,该模型对训练数据的依赖性较弱,在较少(如30个左右)数据的情况下即可得到较为良好的训练效果以及泛化效果。该方法的有效性、高效性以及鲁棒性得到了验证,能为江苏软土路基回弹模量的预测提供新的思路。Abstract: A Gaussian process regression (GPR)-based model for predicting the resilient modulus of Jiangsu soft soils is developed based on the complied database for Jiangsu soft soils in literatures. The model takes the cone penetration test (CPT) data (e.g., tip resistance qc data, and sleeve friction fs data), water content and dry unit weight of soft soils as the input, while provides the predicted resilient modulus as well as quantified uncertainty as the output. By comparing with some conventional machine learning methods, the GPR model can reasonably reflect the correlation between the resilient modulus and the other geotechnical parameters of Jiangsu soft soils. Besides, the GPR model can achieve good performance even when the number of the training dataset is small, which is validated in this study in terms of effectiveness, efficiency and robustness. The GPR method can be considered as a new way for the probabilistic and non-parametric estimation of the resilient modulus of Jiangsu soils.
-
0. 引言
路基回弹模量是路面结构设计中不可或缺的设计参数之一,直接影响了路面设计的厚度等[1-3]。它表征了路基土在弹性变形阶段内,在垂直荷载作用下,抵抗竖向变形的能力。通常,回弹模量可以通过室内试验或现场试验直接获得。然而,由于原状软土土样的获取较为费时费力,因此,通过大量试验获得软土路基的回弹模量并非易事。工程实践中,工程师通常根据路基回弹模量与其他容易获得的土性参数(如静力触探试验CPT数据、含水率、干密度、液限、塑限等)之间的关系,间接估计土体的回弹模量,进而进行设计与分析[4]。
Mohammad等[5]研究发现,软土路基回弹模量Mr与CPT锥尖阻力qc、侧摩阻力fs、土体含水率w以及干重度
γd 有着密切联系。因此,本文重点在于构建回弹模量Mr与上述四个指标之间相关关系的数学模型。与其他土体参数相比,CPT数据几乎是完全连续的[6-10],且土体含水率w以及干重度γd 数据的获取也较为简单。最为常见的经验模型之一即假定Mr与其他土体参数的方程形式,通过最小二乘法获得对应的参数。虽然该方法直接、简单、可操作性强、,但由于方程形式假定的局限性,在不同工程场地的预测效果往往难以尽如人意[5,11]。近年来,国内外研究人员提出基于多维正态概率分布的模型以期解决此类问题。目前,该方法在岩石、砂土、黏土甚至边坡风险预测等领域均有所应用,且取得良好效果[12-15]。然而,该方法对数据量的要求较高,而工程实践中数据量往往相对较少,难以满足要求。此外,该方法要求不同的岩土参数试验数据能够转换成近似服从正态分布的数据,且转换后的试验数据满足线性相关或近似线性相关。该假设通常与实际工程数据有所出入。为解决这一问题,本文提出基于高斯过程回归(gaussian process regression,简称GPR)的方法对江苏省9个城市的路基回弹模量与上述四个土体参数进行建模,从而实现在给定静力触探锥尖阻力qc、侧摩阻力fs、土体含水率w以及干重度
γd 的条件下,对路基回弹模量进行合理估计,并计算估计的标准差,量化估计的可靠性。该方法一方面对数据量的需求相对较小,在小样本数据下即可获得较高的训练精度以及较强的泛化能力;另一方面,该模型具有较强的解译性,能够准确地反映出回弹模量与不同土体参数间依赖关系的强弱,体现了数据驱动的特点。此外,高斯过程回归不需要将输入参数进行非正态空间到正态空间的转换以及保证两两参数之间的线性关系。本文通过已有的江苏部分地区的软土路基参数数据库,系统进行了大量的计算与检验,验证了基于高斯过程回归的模型在预测软土路基回弹模量上的准确性、高效性以及鲁棒性。1. 软土路基参数特征分析
为全面反映江苏省整个区域的软土路基特性,本节收集了文献[4]中江苏省9个城市、15个工程场地的Mr,qc,fs,w以及
γd 数据,共计124组。其中,Mr根据美国AASHTO标准测量,qc和fs由现场圆锥静力触探试验获得,γd 由室内试验常规方法获得。表1总结了五个软土路基参数的均值、标准差、最大值和最小值。最大值、最小值反映了依据此数据集构建方法的适用范围,即12.5 MPa≤Mr≤95.8 MPa,0.22 MPa≤ qc≤3.93 MPa,0.03 MPa≤fs≤0.14 MPa,6.90%≤ w≤78.1%,10.50 kN/m3≤γd ≤19.90 kN/m3。此外,图1绘制了每个参数的直方图,以及任意两参数之间关系的散点图。如图1所示,大多数参数并不严格服从正态分布,且两两之间亦非全部线性相关(如回弹模量Mr与含水率w的散点图)。这也解释了文献[4]采用Johnson’s system distribution或者Box-Cox变换将非正态分布转换为正态分布的原因。但是,上述的转换方法无法保证转换后变量之间的线性相关性,如前文所述。为了解决参数间的非线性问题,qc,fs,w,γd 的非正态性以及对数据量的依赖性,本文采用高斯过程回归的方法对已有少量数据进行建模,详见第2节。表 1 软土回弹模量(Mr)、锥尖阻力(qc)、侧摩阻力(fs)、含水率(w)和干重度(γd )的统计特征Table 1. Statistics of resilient modulus (Mr), tip resistance (qc), sleeve friction (fs), water content (w) and dry unit weight (γd ) of subgrade soft soils软土参数 均值 标准差 最小值 最大值 Mr/MPa 46.09 17.28 12.50 95.80 qc/MPa 1.76 0.85 0.22 3.93 fs/MPa 0.09 0.03 0.03 0.14 w/% 32.00 14.22 6.90 78.10 γd /(kN·m-3)15.86 2.07 10.50 19.90 2. 高斯过程回归建模
2.1 基本原理
高斯过程回归方法是一种非线性的、基于贝叶斯思想的无参推断方法,对于高维数据、小样本数据等具有良好的适应性[16-17]。近年来,该方法在许多领域得到了成功应用。高斯过程回归方法的基本原理是假定因变量的先验分布,如本文中的软土路基回弹模量Mr = f(
qc ,fs,w,γd ),服从多维正态分布,即f(X)~GP(μ(X),k(X,X'))。其中,f (⋅ )表示未知函数。本文中X = (qc,fs,w,γd );μ(X)表示f(X)的均值向量,k(X,X')表示f(X)与f(X')之间的协方差矩阵。通常,可通过预处理使μ(X) = 0。k(X,X')可以表示为[17]k(X,X', (1) 式中 X1 =
,X2 = ,X3 = w,X4 = ; 表示Xi (i = 1,2,3,4) 坐标方向的相关长度,反映了f(X)在Xi坐标方向上 范围内具有较高的相关性。 基于高斯过程的基本特性,f(X)的子集的先验分布仍然服从多维正态分布。假设列向量y表示f(X)的m个观测值,对应m组qc,fs,w,
的已有数据。那么,根据上述讨论,y的先验分布同样服从GP(0, ),即均值为0,协方差为 的高斯分布。 表示y的试验误差。令X*表示待预测点,那么,y和f(X*)的联合分布为 。 (2) 根据高斯过程的解析特性和贝叶斯框架,在给定y的条件下,f(X*)的后验分布仍然服从高斯分布,其均值和协方差分别为
(3) 式(3)表示f(X*)的预测均值
可看作已有试验数据y的权重叠加。权重系数α的分配取决于待预测数据X*与已知测量数据Xy之间的距离。由式(1)可知,距离越近,相似度越高,对应的权重系数越大。若待预测X*只是一组(qc,fs,w, )数据,那么 则表示预测回弹模量的方差。方差越大,表示预测结果越不准确,反之,则说明预测结果较为合理。若X*表示多组数据,那么 为均值向量, 为协方差矩阵,其对角线表示预测结果的方差。毫无疑问,预测结果取决于式(1)中的超参数 (i = 1,2,3,4)、 以及 。超参数不同,预测结果有所不同。因此,如何确定最为合理的超参数值至关重要,详细讨论见2.2节。 2.2 高斯过程回归超参数的估计
为实现超参数最优值的估计,本文采用最大似然估计的方法解决这一问题。最大似然估计的核心是寻找最优的超参数使获得测量数据y的可能性最大。获得测量数据y的可能性可以由其概率密度函数反映,可表示为:
。 (4) 因此,可以通过最大化式(4)或者等价的最小化-lnP(y|Xy)估算出超参数的最优值,即[17]
。 (5) 为了寻找式(5)的最小值,可以采用多种优化算法,如牛顿法、共轭梯度法等。此外,为了降低初始值对最终优化结果的影响,可以对多组初始值进行试运算,最终选取一组对训练结果估算最为准确的变量作为优化的初始值。
3. 工程案例应用
3.1 高斯过程回归模型构建
为了说明高斯过程回归在江苏软土路基回弹模量预测上的适用性,从文献[4]收集的124组数据中随机抽取30组数据以训练高斯过程回归模型。为使该模型预测更加准确、适用范围更广,在构建模型前,首先对30组Xi (i = 1, 2, 3, 4) 数据进行归一化处理,即
, (6) 式中,
和 分别表示m=30组Xi数据的均值与标准差, 对应Xi转换后的数据。式(6)是一种线性转换,不会改变与回弹模量Mr的相关性。因此,回弹模量Mr仍然与归一化锥尖阻力 = qc和软土含水率 = w相关性更大。然后,利用m=30组Mr和归一化后的(qc,fs,w, )数据优化式(5),得到高斯过程回归模型 的最优值分别为 = 5.43, = 31.07, = 5.58, = 17.65。由式(1)可知,k(X,X)主要取决对应于 较小的参数。因此, 越小,理论上对Mr的预测贡献愈明显。由训练结果可知, (对应 )和 (对应w)相对较小,即qc与w对Mr的预测贡献更大。这与图1所示的信息一致,间接反映了高斯过程回归模型的数据驱动特性。 3.2 高斯过程回归模型验证
为了检验参数估计是否合理,将上述参数代入式(2)重新预测30组训练数据的Mr,所得结果与Mr试验值的对比如图2(a)所示,对应的决定系数R2 = 0.97。为了检验模型的泛化能力,即给定新的Xi时Mr预测的准确性,这里基于剩余的94组Xi数据(需要归一化处理),可得到回弹模量Mr的预测均值,如图2(b)所示。Mr的预测值与试验值的决定系数R2 = 0.96。无论在训练集或是在验证集中,这组试验中决定系数R2均大于0.95,这表示基于高斯过程回归模型的预测具有较高的准确度。为了更好地对比预测结果,图3绘制了Mr预测值与试验值的对比图,实线表示从小到大Mr的试验值,长虚线表示由高斯过程回归模型得到的Mr的预测值,短虚线表示预测均值±1.96预测标准差,对应了Mr预测值的95%置信区间。由图3可知:①Mr预测值与试验值在绝大多数情况下非常匹配;②Mr试验值绝大多数(88/94= 93.6%)落在由高斯过程回归模型所得的95%置信区间内。这些结果均表示基于高斯过程回归模型回弹模量的预测比较合理,且量化的不确定性符合预期。
然而,上述结果(图2,图3)只是基于一次随机试验。为了更好地验证本文中所用高斯过程回归模型的鲁棒性,重复上述随机试验100次:即随机将124组数据分成m=30的训练集以及m=94的验证集,然后每次训练后可以计算验证集对应的R2。因此,可得对应于100次验证集的100个R2。图4绘制了100个R2的箱型图。由图4可以看出,基于30组数据训练的高斯过程回归模型在验证集上的预测值对应的R2基本全部高于0.92。这说明高斯过程回归模型具有较高的鲁棒性,且可以准确地基于(qc,fs,w,
)数据预测软土地基回弹模量。 此外,为了讨论训练数据量m对预测结果的影响,分别取m = 45,60,75对高斯过程回归模型进行训练。具体过程与前文m = 30一致,均随机进行100次试验。对应的结果仍然以箱型图的形式呈现,如图4所示。由图4可知,随着训练集数据m的增加,高斯过程模型泛化能力逐渐提高,预测结果愈加准确,这与预期完全一致。同时,训练集数量增加后,高斯过程回归模型获得了更为准确的超参数,因此,预测结果更为合理、鲁棒性更好。由图4可以看出,当m ≥ 60时,R2的最小值大于0.95;且相比m=30和m=45,100次随机试验结果的变异性更小。
4. 结论
本文在已有江苏软土地基数据集的基础之上,提出了高斯过程回归的建模方法。通过对不同样本数目的训练集的建模分析,验证了高斯过程回归方法在江苏软土路基回弹模量预测上的准确性、高效性以及鲁棒性。主要得出以下结论:
(1)高斯过程回归方法可以准确地反映江苏软土回弹模量与不同土参数间的相互关系,体现了高斯过程回归的数据驱动特性。
(2)小样本条件下,高斯过程回归模型针对江苏软土路基回弹模量的预测值与试验值之间的拟合程度(R2)最高可达到0.97,最低亦可达0.93。
(3)高斯过程回归模型的准确度、鲁棒性均随着训练样本数目的增大而不断提高。当训练数据由30增长到75时,100次随机试验中,验证集中预测值R2的均值由0.957提升至0.975,标准差由0.011降低到0.005。
-
表 1 软土回弹模量(Mr)、锥尖阻力(qc)、侧摩阻力(fs)、含水率(w)和干重度(
)的统计特征 Table 1 Statistics of resilient modulus (Mr), tip resistance (qc), sleeve friction (fs), water content (w) and dry unit weight (
) of subgrade soft soils 软土参数 均值 标准差 最小值 最大值 Mr/MPa 46.09 17.28 12.50 95.80 qc/MPa 1.76 0.85 0.22 3.93 fs/MPa 0.09 0.03 0.03 0.14 w/% 32.00 14.22 6.90 78.10 /(kN·m-3) 15.86 2.07 10.50 19.90 -
[1] 陈开圣, 沙爱民. 压实黄土回弹模量试验研究[J]. 岩土力学, 2010, 31(3): 748-752, 759. doi: 10.3969/j.issn.1000-7598.2010.03.014 CHEN Kai-sheng, SHA Ai-min. Research on resilient modulus test of compacted loess[J]. Rock and Soil Mechanics, 2010, 31(3): 748-752, 759. (in Chinese) doi: 10.3969/j.issn.1000-7598.2010.03.014
[2] 武红娟, 徐伟, 王选仓. 土基模量随季节变化规律及其数值的确定[J]. 工程地质学报, 2008, 16(1): 32-36. doi: 10.3969/j.issn.1004-9665.2008.01.007 WU Hong-juan, XU Wei, WANG Xuan-cang. Seasonal variations of subgrade soil resilient moduli and their value determination[J]. Journal of Engineering Geology, 2008, 16(1): 32-36. (in Chinese) doi: 10.3969/j.issn.1004-9665.2008.01.007
[3] 刘维正, 曾奕珺, 姚永胜, 等. 含水率变化下压实路基土动态回弹模量试验研究与预估模型[J]. 岩土工程学报, 2019, 41(1): 175-183. https://www.cnki.com.cn/Article/CJFDTOTAL-YTGC201901024.htm LIU Wei-zheng, ZENG Yi-jun, YAO Yong-sheng, et al. Experimental study and prediction model of dynamic resilient modulus of compacted subgrade soils subjected to moisture variation[J]. Chinese Journal of Geotechnical Engineering, 2019, 41(1): 175-183. (in Chinese) https://www.cnki.com.cn/Article/CJFDTOTAL-YTGC201901024.htm
[4] LIU S Y, ZOU H F, CAI G J, et al. Multivariate correlation among resilient modulus and cone penetration test parameters of cohesive subgrade soils[J]. Engineering Geology, 2016, 209: 128-142. doi: 10.1016/j.enggeo.2016.05.018
[5] MOHAMMAD L N, HERATH A, ABU-FARSAKH M Y, et al. Prediction of resilient modulus of cohesive subgrade soils from dynamic cone penetrometer test parameters[J]. Journal of Materials in Civil Engineering, 2007, 19(11): 986-992. doi: 10.1061/(ASCE)0899-1561(2007)19:11(986)
[6] 刘松玉, 吴燕开. 论我国静力触探技术 (CPT)现状与发展[J]. 岩土工程学报, 2004, 26(4): 553-556. doi: 10.3321/j.issn:1000-4548.2004.04.025 LIU Song-yu, WU Yan-kai. On the state -of-art and development of CPT in China[J]. Chinese Journal of Geotechnical Engineering, 2004, 26(4): 553-556. (in Chinese) doi: 10.3321/j.issn:1000-4548.2004.04.025
[7] 张诚厚, 施健, 戴济群. 孔压静力触探试验的应用[J]. 岩土工程学报, 1997, 19(1): 52-59. https://www.cnki.com.cn/Article/CJFDTOTAL-YTGC701.007.htm ZHANG Cheng-hou, SHI Jian, DAI Ji-qun. The application of piezocone tests in China[J]. Chinese Journal of Geotechnical Engineering, 1997, 19(1): 52-59. (in Chinese) https://www.cnki.com.cn/Article/CJFDTOTAL-YTGC701.007.htm
[8] 蔡国军, 刘松玉, 童立元, 等. 基于静力触探测试的国内外砂土液化判别方法[J]. 岩石力学与工程学报, 2008, 27(5): 1019-1027. doi: 10.3321/j.issn:1000-6915.2008.05.018 CAI Guo-jun, LIU Song-yu, TONG Li-yuan, et al. Evaluation of liquefaction of sandy soils based on cone penetration test[J]. Chinese Journal of Rock Mechanics and Engineering, 2008, 27(5): 1019-1027. (in Chinese) doi: 10.3321/j.issn:1000-6915.2008.05.018
[9] LUNNE T, POWELL J J, ROBERTSON P K. Cone Penetration Testing in Geotechnical Practice[M]. London, UK: Taylor & Francis, 1997.
[10] ZHAO T Y, XU L, WANG Y. Fast non-parametric simulation of 2D multi-layer cone penetration test (CPT) data without pre-stratification using Markov Chain Monte Carlo simulation[J]. Engineering Geology, 2020, 273: 105670. doi: 10.1016/j.enggeo.2020.105670
[11] PHOON K K. Modeling and simulation of stochastic data[C]//GeoCongress 2006. February 26-March 1, 2006, Atlanta, Georgia, USA. Reston, VA, USA: American Society of Civil Engineers, 2006: 1-17.
[12] CHING J, LIN G H, PHOON K K, et al. Correlations among some parameters of coarse-grained soils—the multivariate probability distribution model[J]. Canadian Geotechnical Journal, 2017, 54(9): 1203-1220. doi: 10.1139/cgj-2016-0571
[13] CHING J, PHOON K K. Correlations among some clay parameters—the multivariate distribution[J]. Canadian Geotechnical Journal, 2014, 51(6): 686-704. doi: 10.1139/cgj-2013-0353
[14] CHING J, PHOON K K, LI K H, et al. Multivariate probability distribution for some intact rock properties[J]. Canadian Geotechnical Journal, 2019, 56(8): 1080-1097.
[15] XU L, YAN D D, ZHAO T Y. Probabilistic evaluation of loess landslide impact using multivariate model[J]. Landslides, 2021, 18(3): 1011-1023.
[16] 何志昆, 刘光斌, 赵曦晶, 等. 高斯过程回归方法综述[J]. 控制与决策, 2013, 28(8): 1121-1129, 1137. https://www.cnki.com.cn/Article/CJFDTOTAL-KZYC201308002.htm HE Zhi-kun, LIU Guang-bin, ZHAO Xi-jing, et al. Overview of Gaussian process regression[J]. Control and Decision, 2013, 28(8): 1121-1129, 1137. (in Chinese) https://www.cnki.com.cn/Article/CJFDTOTAL-KZYC201308002.htm
[17] RASMUSSEN C E, WILLIAMS C K I. Gaussian Processes for Machine Learning[M]. Cambridge, Massachusetts: The MIT Press, 2005.
-
期刊类型引用(15)
1. 宋超,赵腾远. 黏土路基回弹模量预测及贝叶斯模型选择研究. 长沙理工大学学报(自然科学版). 2024(01): 88-99 . 百度学术
2. 杨威. 基于原位测试方法的土体变形参数研究. 安徽建筑. 2024(04): 141-143 . 百度学术
3. 郑可馨,吴益平,李江,苗发盛,柯超. 基于高斯过程回归的岩体结构面粗糙度系数预测模型. 地质科技通报. 2024(04): 252-261 . 百度学术
4. 张化进,吴顺川,李兵磊,赵宇松. 基于高斯过程回归的岩石抗剪强度参数不确定性估测. 岩土力学. 2024(S1): 415-423 . 百度学术
5. 贾玉博,杨宏伟,粟晓玲,褚江东,徐吉海. 基于水代谢和水循环理论的石羊河流域水资源承载力评价. 水资源保护. 2024(05): 86-94+157 . 百度学术
6. 李军. 基于城市级实景三维模型快速构建的方法. 北京测绘. 2024(10): 1437-1442 . 百度学术
7. 冯易鑫 ,彭辉 ,罗威 . 聚类分析-神经网络-贝叶斯优化联合识别复合材料参数研究. 力学学报. 2024(11): 3333-3350 . 百度学术
8. 李宏宝. 公路工程中软土路基换填施工技术研究. 科学技术创新. 2023(12): 174-177 . 百度学术
9. 崔瑜瑜,吴立鹏,沈兴华,王兴召,秦亚琼,刘杰,卢正,吴磊. 粉质黏土基坑卸荷隆起变形的简化计算方法. 岩土力学. 2023(05): 1425-1434 . 百度学术
10. 曹阳健. 基于原位测试方法的土体变形参数研究. 砖瓦. 2023(06): 66-69 . 百度学术
11. 宋超,赵腾远,许领. 基于贝叶斯高斯过程回归与模型选择的岩石单轴抗压强度估计方法. 岩土工程学报. 2023(08): 1664-1673 . 本站查看
12. 田波,王昊武,权磊,谢晋德,朱旭伟. 基于CPT试验的多年冻土区路表变形风险评价. 公路交通科技. 2023(09): 1-7+53 . 百度学术
13. 徐明,康雅晶,马斯斯,张鹤. 基于贝叶斯优化的XGBoost模型预测路基回弹模量. 公路交通科技. 2023(11): 51-60 . 百度学术
14. 赵腾远,宋超,谌文武,郭志谦,许领. 基于k-means聚类与高斯过程分类的土遗址裂隙病害发育等级概率预测. 石窟与土遗址保护研究. 2023(04): 75-86 . 百度学术
15. 王建强. 基于泊松曲线法的市政道路软土路基处理方法研究. 工程技术研究. 2022(20): 41-43 . 百度学术
其他类型引用(3)