logo

基于钻进数据定量解译的隧道围岩完整性评价

地质工程 • 土木工程

基于钻进数据定量解译的隧道围岩完整性评价

金涛
振浩
辉辉
彦飞
中南大学学报(自然科学版)第56卷, 第9期pp.3820-3834纸质出版 2025-09-26
9002

为实现围岩完整性的随钻智能评价,提出了一种基于钻进数据定量解译的隧道围岩完整性评价方法。在对超前钻探钻进数据预处理的基础上,定量解译了钻进数据的时频域特征。采用特征优选方法确定了能够反映围岩完整性的最优钻进指标组合,结合随机森林和贝叶斯优化算法建立了围岩完整性系数预测模型,并以某铁路隧道工程为例开展工程验证与应用。研究结果表明:经过贝叶斯优化的随机森林预测模型效果最佳,模型在训练集上的决定系数R2为0.959 7,均方根误差ERMSE为0.02,平均绝对百分比误差EMAPE为6.35%;在测试集上的R2为0.925 4,ERMSE为0.03,EMAPE为8.03%,显著优于基线模型。本文建立的隧道围岩完整性预测模型的学习能力和泛化能力较强,可实现钻进过程中隧道围岩完整性的有效评价。

钻进参数围岩完整性时频域特征特征优选随机森林

岩体完整性评价是隧道、水利、边坡等岩土工程领域的一项基础工作,准确评估岩体完整性可为施工方案设计、地质灾害风险评估及工程可行性评估提供科学依据[1-3]。目前,隧道与地下工程建设正朝着深埋、超长方向迈进,在施工过程中遇到的地质状况愈发复杂[4-5],对更加精准、迅速地获取掌子面前方岩体完整性提出了新的要求。随钻测量技术可以实时获取钻进速度、钻进压力、钻进扭矩等钻进参数,这些参数蕴含着丰富的地质信息[6-11],能够为岩体完整性评价提供宝贵的数据支持。

大量研究表明钻进过程中的钻进参数与岩体结构之间存在着显著关联性,可将其用于隧道围岩完整性评价。岳中琦[12]利用DPM钻孔过程实时监测到的钻进数据来计算岩体弹性纵波速度,实现了对岩体完整性测量的完善与提升。AALIZAD等[13]自主研发了适用于工程现场的钻孔监测仪,发现钻速与岩体完整性之间有很强的相关性。姬付全等[14]建立了钻进参数主成分与隧道围岩完整性的关系模型,实现了岩体完整性的定量划分。许明等[15]根据钻机工作参数和地层岩土体物理力学参数特性,建立了钻进过程地层识别系统模型。上述方法主要是通过数理统计(数据拟合)的方式研究钻进参数与岩体完整性的关系,由于钻进参数与岩体完整性之间呈现出复杂的非线性关系,而常规的数理统计方法难以进行深入研究,预测模型的适用范围有限。随着人工智能技术的发展,部分学者开始使用机器学习方法来研究钻进数据与岩体完整性之间的关系。GHOSH等[16]依托工程现场钻进试验,收集了钻进速度、钻进压力等4种钻进参数,结合机器学习算法实现了对隧道掌子面前方岩体空洞及破碎带的预测。房昱纬等[17]以钻进参数原始数据和每组数据的标准差作为输入变量,结合BP神经网络构建了地层识别模型。梁铭等[18-19]在对各钻探数据进行等距分割的基础上,选取了均值和方差进行二次计算,形成了钻进参数二级指标作为机器学习模型的输入,以围岩级别作为标签,构建了基于超前钻探数据的隧道围岩完整程度评价模型。

总体来说,现有研究虽初步建立了基于钻进数据的岩体完整性评价模型,但多是简单地将某一段落内各钻进参数的均值、方差等参数直接与岩体完整程度建立联系,并未充分挖掘段落内各参数与围岩完整性密切相关的钻进数据特征,进而导致所提出的岩体完整性随钻评价方法适用性和可靠性不足。为解决上述问题,本文首先在对隧道工程现场钻进数据进行预处理的基础上,定量解译了裂隙围岩中钻进数据的波动特征,在进一步特征优选的基础上,确定了能够反映围岩完整性的最优钻进指标组合,结合贝叶斯优化的随机森林算法,建立了围岩完整性系数预测模型,进而提出了基于钻进数据定量解译的隧道围岩完整性评价方法。最后,以某重大铁路隧道工程为例开展工程实例应用,实现了基于钻进过程的围岩完整性评价,验证了该方法的有效性,为基于钻进过程的隧道围岩完整性识别提供了新思路和新途径。

1 钻进数据定量解译与特征优选

1.1 钻进数据预处理

在工程实际的钻进工作中,受钻进设备、采集设备、钻进环境、人员操作等客观因素的影响,所采集的钻进数据不可避免地混杂一些漂移、残缺、失真及处于特殊状态的异常数据。为提高钻进数据的质量以更准确地反映围岩破碎情况,首先需要对获取的钻进数据进行预处理,具体步骤包括异常数据处理、数据降噪、数据插值和段落划分4项。

在钻进初始阶段,由于受到钻机空转、开孔及掌子面喷浆等因素的影响,所采集的钻进数据并不具备解译价值,因此,应将钻进初始阶段的异常钻进数据直接剔除。在正常钻进过程中,由于受换杆操作的影响,钻压、转速、钻速、扭矩和钻进深度在一定时间内均会出现异常变化,同样将这些数据剔除。在剔除上述异常钻进数据后,所对应的钻进时间因缺失而出现不连续的现象(图1),为便于后续的分析,应对此类时间数据进行衔接处理。此外,受钻机设备稳定性及钻进参数采集设备精度的影响,钻进数据会产生不规则性和粗糙性。小波分析可以从多尺度、分辨率方面对信号进行分析从而发掘其中的隐含信息,有效抑制随机噪声。通过选取一个合适的阈值,可以使信号趋向于真实值[20]。因此,本文选择小波阈值降噪方法对钻进数据进行降噪处理。小波阈值降噪的基本原理是信号经过小波变换得到的小波系数含有重要时频信息,真实信号的小波系数较大,噪声的小波系数较小,选取一个合适的阈值即可保留信号并滤除噪声。

图1
异常值剔除后的时间不连续段落示例
pic

钻进参数采集设备的采样频率并不固定,为便于后续对各钻进参数的二级指标波动信号特征进行时域、频域分析及特征提取,采用插值方法将原始钻进信号的采样频率进行固定处理。本文采用简单直观的线性插值方法将采样频率统一预处理为1 Hz。在隧道及地下工程中,围岩完整性均是按段落进行评价,因此,在对钻进数据完成降噪处理后,需根据实际需求进一步对钻进数据进行等距分割,以便分段研究钻进数据特征及其对应的围岩特征。本文中,考虑到所依托工程隧道单循环开挖长度为1 m左右,因此,将各钻进数据划分间距定为1 m。

1.2 钻进数据特征指标解译与优选
1.2.1 钻进数据特征定量解译

钻进参数信号由多个具有不同调幅-调频特征的信号分量组成。如何从预处理完成后的钻进参数信号中解译出与围岩完整性密切相关的动态变化特征,是实现围岩完整性随钻评价的关键。预处理后的钻进信号可作为一种时域信号,通过时频分析方法又可将时域信号转换到频域进行观察,本文拟从时域和频域这2个角度对钻进参数波动特征进行全面解译和提取。

1) 钻进信号时域特征提取。

时域特征反映了信号在时间域上的变化规律,是动态信号最基本、最直观的表达。时域信号中主要提取的时域特征可分为2种:一种是有量纲参数,常用于描述信号的强度特征,本文选择了最大值、最小值、峰峰值、平均值、均方根值、标准差、信号总值7个指标;另一种是量纲一参数,常用于表征信号的波形和变化特征,本文选择峭度、偏度、峰值因子、脉冲因子、波形指标、裕度因子6个指标。以下是相关指标的计算方法,其中,xi为信号值(i=1,2,3,…,n),N为信号样本总数。

最大值xmax表示同一段钻进信号pic的最大瞬时幅值,

pic (1)

最小值xmin表示同一段钻进信号pic的最大瞬时幅值,

pic (2)

峰峰值xpeak表征信号整体振幅,

pic (3)

平均值pic表示段内各采样点的平均幅值,

pic (4)

均方根值xrms反映信号能量平均水平,

pic (5)

标准差xstd用于刻画信号波动强度,

pic (6)

信号总值xE用于衡量总能量大小,

pic (7)

峭度K用于描述波形尖锐程度、异常尖峰敏感性,

pic (8)

偏度S用于描述波形对称性,

pic (9)

峰值因子P用于衡量最大峰值相对能量大小,

pic (10)

脉冲因子I用于衡量单点尖峰程度,

pic (11)

波形指标W用于衡量波形平坦度,

pic (12)

裕度因子M用于综合反映信号裕量:

pic (13)

2) 钻进信号频域特征提取。

频域分析可从频域角度了解信号幅值在频率范围内的分布情况,从而进一步反映信号的复杂变化。本文拟通过经典的时频分析方法——快速傅里叶变换(fast fourier transform, FFT),将时域钻进信号转换为频域,获取相应的频谱图,再对信号进行频域特征提取。本文采用频域幅值平均值、重心频率、均方频率、频率方差对信号进行频域特征描述[21-22],各频域特征的计算方法如下。

频域幅值平均值Am表示平均谱幅,

pic (14)

重心频率Fc反映能量中心,

pic (15)

均方频率Msf用于刻画频谱能量分布,

pic (16)

频率方差Vf用于度量频域离散性;

pic (17)

式中:fi为频率;pi为相应的幅值(钻速或扭矩等)。

1.2.2 钻进数据特征指标优选

合理选择特征指标作为围岩完整性评价模型的输入参数是机器学习的关键步骤。为了在不降低围岩完整性评价质量的前提下筛选出反映围岩完整性的关键因素,本文采用RReliefF算法并结合Pearson相关系数来完成指标特征优选。RReliefF算法是一种经典的过滤式特征选择算法,专门用于解决回归模型的特征选择问题[23],该算法通过引入2个相异实例的概率建立模型:

pic (18)pic (19)pic (20)

式中:pic为实例在特征A上的差异值;pic为实例的预测差异值;pic为相近实例;PdiffA为在相近实例中在特征A上的差异概率;PdiffC为在相近实例中的预测值差异概率;PdiffC|diffA为在特征A上有差异的相近实例中的预测值差异概率。根据贝叶斯公式,特征A的权值W(A)表示为:

pic (21)

结合上述公式可以估算出各输入特征的权值,算法的实施流程和伪代码如图2所示。

图2
RReliefF算法伪代码
pic

为减少各特征指标之间因较大相关性而对数据集造成的重复干扰,确定最优特征指标组合,本文进一步引入Pearson相关系数对选出的特征指标进行二次筛选。2个特征指标之间的Pearson相关系数计算式如下。

pic (22)

式中:r为Pearson相关系数,取值范围为[-1,1];picx的均值;picy的均值;n为样本总数。

r的绝对值较大时,2个变量间的相关性较强。|r|大于0.8时表明参数之间存在强相关性,小于0.2则表明参数之间存在弱相关性[24]。在实际检验过程中,选择将|r|>0.8的特征指标中的一组进行剔除。

RReliefF-Pearson特征指标优选方法的流程见图3。具体步骤如下:首先基于所提取的钻进曲线时域特征和频域特征构建初始特征指标数据集,并采用Min-Max标准化对数据集进行预处理;使用RReliefF算法寻找各特征指标与围岩完整性系数之间的相似度和差异度,以权重表示特征指标对围岩完整性系数的重要程度并进行排序;通过对各特征指标的权重进行对比分析确定权重阈值,进而剔除小于权重阈值的特征指标。为去除RReliefF算法下的冗余特征指标,引入Pearson相关系数对选出的特征指标进行二次筛选求解特征指标之间的相关性,并剔除相关性较高的特征指标,最后得到最优特征指标,完成特征指标的降维与选择。

图3
RReliefF-Pearson特征指标优选流程
pic

2 围岩完整性预测模型构建

2.1 主要算法介绍

随机森林算法(random forest,RF)是一种以决策树为基学习器并结合Bagging集成思想的非线性统计集成算法,广泛用于分类和回归分析[25]。随机森林通过构建多棵决策树对样本进行训练,然后,通过集成决策树的结果来提高模型的准确性和稳定性。算法原理如图4所示。随机森林有2个重要的随机性来源:一是数据的随机性,二是特征的随机性。对于数据的随机性,随机森林算法使用自助采样法从原始数据集中随机选择n个样本,组成一个新的训练数据子集,这个新的数据子集被用来训练一个新的决策树。对于特征的随机性,随机森林算法在每个决策树的节点上随机选择m个特征,并从这m个特征中选择最佳的特征用于分裂。

图4
随机森林算法原理示意图
pic
2.2 模型训练与构建

在机器学习模型中,超参数的设定对模型的运算效率和泛化性能有重大影响。超参数优化就是寻找这些超参数的最优设定,将模型在验证集上的泛化性能最大化。贝叶斯优化算法(bayesian optimization,BO)是一种基于高斯过程和贝叶斯定理的全局优化算法,该算法利用已有的样本点构造代理函数近似替代黑箱目标函数,降低了计算目标函数的时间成本,并引入了采集函数,对损失函数最小的评估点进行有效探索和利用,能在较少的评估次数下取得复杂目标函数的最优解[26-27]。为寻求预测性能最优的模型,采用BO算法对RF的超参数进行优化,通过设置参数空间对指定的超参数进行搜索,以获取最优超参数组合,RF拟优化的超参数组合及寻优范围见表1。超参数寻优迭代次数定为200次,并选取均方根误差ERMSE作为模型每次迭代后的评价分数。在寻优过程中,通过迭代尝试不同的超参数组合,记录并保存超参数组合和模型评价分数。在五折交叉验证下经过200次迭代,预测模型总共被建立和评价5×200=1 000次,最终通过选取模型最佳分数来确定最优的超参数组合。

表1
随机森林待优化的超参数及对应的寻优范围
算法超参数寻优范围
RF树的数量10~500
最大树深1~50
寻找最佳分割时要考虑的最大特征数sqrt, log2
内部节点再划分所需的最小样本数2~10
叶子节点所需的最小样本数1~10
展开更多

本文采用Jupyter Notebook作为Python语言开发环境,依托Scikit-learn机器学习库作为预测模型建立的基础工具,实现数据加载切分、数据预处理、模型建立及训练结果保存等步骤。模型训练与构建过程如下。

1) 数据加载及切分。指定数据库文件所在路径,加载数据,对加载后的数据进行切分处理,完成模型输入特征和输出标签的分离与确定。

2) 数据预处理。对数据集中的异常值进行处理,检查是否含空值或无穷大值。为消除数据集中各输入特征之间量纲的限制、提高模型迭代收敛的速度等,对数据集进行Z-Score标准化处理,将样本数据集均值转换为0、标准差为1,使得数据分布符合标准正态分布。

3) 数据集划分。为确保训练集和测试集的数据之间具有相互独立性,对数据集进行随机划分。常见的训练集和测试集划分比例为7꞉3和8꞉2[28-30],经实际验证对比后,本文所选择的训练集和测试集的划分比例为8꞉2。

4) 模型构建及预测。通过调用Scikit-learn库中的Random Forest Regressor函数,设置模型初始超参数,构建初始模型,采用5折交叉验证对随机森林模型进行训练。基于表1执行贝叶斯算法的超参数优化,并使用最优超参数组合进行后期的训练与预测。在模型训练完成后,再分别对训练集和测试集进行预测。

2.3 模型评估

为全面评估预测模型的预测性能,选择均方根误差ERMSE、决定系数R2和平均绝对百分比误差EMAPE这3种指标,相应计算公式见表2。其中,R2表征回归模型对观测数据拟合的准确程度,其值越接近1表明模型的拟合效果越好;ERMSE表征回归模型预测值与真实值的偏离程度;EMAPE为预测值和真实值之间绝对误差的平均值。

表2
预测模型的评价指标
评价指标计算公式评判标准
R2pic数值越大,模型的预测性能越好
ERMSEpic数值越小,模型的预测性能越好
EMAPEpic数值越小,模型的预测性能越好
展开更多

3 工程案例分析

3.1 工程概况及现场试验

为验证所提围岩完整性评价方法的有效性,依托我国正在建设的某铁路隧道的辅助坑道2号斜井工程,现场采集了钻进数据及其所对应的围岩完整性数据,开展了围岩完整性评价案例分析与验证。该工程位于我国高原地区,海拔高程在 4 100 m以上,属构造剥蚀高山-极高山地貌,最大埋深超过800 m,为高原深埋隧道。隧址区主要发育有燕山期正长花岗岩、二长花岗岩,多呈弱风化到强风化,节理裂隙较发育,工程地质条件从一般到较差。受构造运动及后期风化作用的影响,该段围岩岩体完整性差,围岩类别主要为IV类和Ⅴ类。钻探数据收集于2号斜井中的5次超前地质钻探工作,每次超前探孔施作长度为20~30 m不等,钻进参数采集系统的采样频率约为90条/m,共收集原始钻进数据10 000余条,累计覆盖隧道长度约120 m。在超前钻探作业完成后,对探孔进行了孔内声波测试,以便定量化获取隧道围岩的完整情况。受时间和成本的约束,现场每次超前钻探作业仅施作1孔。因此,使用非金属声波检测仪的一发双收探头对超前探孔进行声波测试(采样间隔为0.2 m),进而获取隧道围岩的纵波波速。基于后续隧道开挖过程中的岩块采样及钻孔取芯,用于开展岩石声波测试和饱和单轴抗压强度测试,隧道围岩的完整性系数Kv计算式[31]式(23)所示。

pic (23)

式中:Vpm为岩体纵波波速,km/s;Vpr为岩石纵波波速,km/s。

最终120 m超前钻孔采集岩体纵波波速约600组,经过现场取样及后续的钻孔取芯,获取完整岩石的纵波波速112组,故而计算出围岩Kv共112组,其统计结果见图5。从图5可以看出:现场隧道围岩的完整性系数在0.10到0.45之间,参照表3Kv与围岩完整程度的对应关系[31],所研究隧道段落的围岩完整性主要分为极破碎、破碎和较破碎共3种,占比分别为5.88%、69.75%及24.37%,以较破碎围岩为主。

图5
围岩完整性系数Kv统计图
pic
表3
Kv与围岩完整程度的对应关系
参数范围Kv>0.750.75≤Kv<0.550.55≤Kv<0.350.35≤Kv<0.15Kv≤0.15
完整程度完整较完整较破碎破碎极破碎
展开更多
3.2 钻进数据定量解译结果分析

基于前文所提出的钻进数据预处理及指标提取方法,以2号斜井X2DK2+261.1~X2DK2+235.2里程段(长度为25.8 m)的钻压和钻速数据为例,将原始钻进数据与异常值剔除、降噪和插值预处理后的钻进数据对比如图6图7所示。

图6
钻进数据曲线随深度变化对比
pic
图7
钻进数据曲线随时间变化对比
pic

图6可以看出进行预处理后的数据在一定程度上滤除了因钻具振动等因素所产生的噪声,因而钻进参数能够更加准确地反映出围岩的真实情况。从图7可以看出,进行预处理后的钻进数据有效剔除了因换杆停机等因素导致的非正常时间记录,真实地反映了各钻进参数在时间上的变化特征,为后续的钻进数据时域分析奠定基础。此外,图6图7显示钻压与转速受操作和地质变化影响显著。因此,在钻进数据进行段落划分处理后,对各段落的钻压、转速、钻速和扭矩的波动特征进行时频域分析和特征指标提取,将其作为围岩完整性评价模型构建的初选特征。以2号斜井X2DK2+261.1~X2DK2+235.2里程的26段钻速为例,其时频特征指标见表4表5

表4
2号斜井X2DK2+261.1~+235.2里程处钻速的时域特征指标
段落xmaxxminxpeckpicxrmsxstdKSxEWPIM
184.3016.7941.5767.51157.4012.556.491.8243.401.041.561.621.66
284.8634.8445.6350.03102.7310.144.791.3246.731.021.071.101.11
375.7413.5935.9862.1584.479.196.411.4037.121.031.671.731.75
480.4421.3732.9159.07123.9611.138.792.3534.731.061.701.791.83
565.9810.3829.6155.5941.596.4514.892.6130.311.021.831.881.90
685.7522.3634.8963.39166.0312.896.231.8437.171.071.711.821.87
773.6418.6736.1254.9767.548.226.581.3737.031.031.481.521.54
8123.6621.3354.03102.34609.6724.693.971.4059.331.101.721.891.98
9112.2626.0351.9386.24354.3218.823.130.7755.191.061.561.661.71
1099.1330.8849.9468.26254.7915.963.791.2352.391.051.301.371.40
11128.7828.6060.35100.18527.7922.973.550.9764.511.071.551.661.72
12152.901.6523.11151.26132.4911.51100.599.1925.801.125.866.546.73
1369.5119.2928.2850.22112.1610.596.251.9830.181.071.661.781.83
1489.9717.6948.8072.27408.8920.221.580.3252.811.081.371.481.55
15180.3720.5961.28159.781 337.7036.574.061.1571.221.162.242.612.83
1656.457.21820.4749.2371.228.4412.863.2222.131.082.222.402.47
1785.1919.8237.0265.36206.4414.373.951.1339.691.071.651.771.83
18118.4810.1526.94108.32286.8916.9412.582.8531.791.183.414.024.29
1963.3210.3025.8953.02158.0312.573.531.2428.771.111.842.052.15
20135.5519.7946.39115.76589.8224.295.561.6952.291.132.212.502.64
21138.4213.0026.03125.42581.8824.129.872.5835.431.363.544.825.51
2263.099.2730.9953.83150.5412.272.390.4433.311.071.621.741.81
2387.3810.0519.7977.3490.449.5125.474.2121.951.113.523.914.05
2427.939.8613.2618.075.622.3715.502.8713.471.021.341.361.37
2558.138.8112.3949.3224.684.9736.755.2813.351.083.703.984.07
2696.227.5713.4988.6538.416.20130.5210.0614.841.105.976.576.73
展开更多
表5
2号斜井X2DK2+261.1~X2DK2+235.2里程钻速的频域特征
段落AmFcMsfVf段落AmFcMsfVf
13.360.050.110.09144.820.050.100.09
23.610.050.110.10159.740.080.140.11
32.460.050.110.10161.110.060.120.10
42.500.070.130.11172.780.050.110.10
51.700.050.110.10182.230.060.120.10
62.700.050.110.09191.710.070.130.11
72.530.070.140.12205.580.070.120.10
87.030.070.140.11212.940.090.160.12
95.150.050.110.10222.060.040.080.07
104.970.060.130.12231.200.070.120.09
117.150.060.120.10240.330.040.100.09
122.200.150.220.15250.490.080.130.10
131.760.060.120.11260.950.160.220.15
展开更多

最终提取特征指标组合包括4种钻进参数,共计68项,分别标记为X1~X68。其中,X1~X17为钻速的时频特征指标,X18~X34为扭矩的时频特征指标,X35~X51为钻压的时频特征指标,X52~X68为转速的时频特征指标。对2号斜井的5次超前钻孔的钻进参数进行指标提取后,获取钻进特征指标组合119组。由于现场获取的Kv仅有112组,最终整理出包含112组数据的数据集,用于构建Kv预测模型。采用RReliefF算法对4种钻进参数的特征指标组合进行优选,并根据权重从大到小进行排序,特征权重值越大,表明该特征对于回归模型越重要,为保证所训练模型的准确度,适当放宽特征筛选的数量,本文以0.005作为特征筛选的阈值,最终筛选出23个特征,如图8所示。

图8
围岩完整性评价特征指标权重图
pic

特征筛选后,利用Pearson相关系数求解初步筛选后各特征之间的相关性。综合考虑特征权重,剔除具有强相关性(r>0.8)的特征指标,保留权重较大且与其他特征相关性较弱的特征,获取最优的围岩完整性评价指标组合,如图9所示。具体包括钻速最大值、钻速最小值、钻速标准差、钻速均方根、钻速平均频率、扭矩平均值、扭矩均方根、扭矩峰值因子、扭矩脉冲因子、扭矩平均频率、钻压峭度、钻压平均频率、转速最大值、转速最小值、转速平均值、转速峭度、转速均方根、转速平均频率共18个钻进特征指标。

图9
用于围岩完整性性评价的最优指标组合相关性热力图
pic
3.3 围岩完整性预测模型构建及结果分析

为对比验证本节提出的BO-RF模型的优越性以及围岩完整性评价指标体系的优越性,从输入特征划分和超参数优化2个方面设计了模型训练方案。方案1为本文的所提方法,其输入指标为优选的18个钻进特征指标(F1),预测模型为BO-RF。方案2的输入参数为原始4个钻进参数的各段均值(F2),预测模型为BO-RF;对比两者验证围岩完整性评价指标体系的优越性。方案3的输入参数为优选的18个钻进特征指标(F1),预测模型为RF,与方案1对比用于验证所提BO-RF模型的优越性。方案1的寻优结果见表6,不同方案条件下模型的评估结果见表7。从表7可以看出:方案1在训练集和测试集上的R2分别为0.959 7和0.925 4,ERMSE分别为0.02和0.03,EMAPE分别为6.35%和8.03%。该方案在训练集与测试集上的各项评价指标均表现最好,表明该模型不仅在训练集上有较强的学习能力,在测试集上也表现出了较好的泛化性能。方案2在训练集和测试集上的R2分别为0.872 9和0.842 5,ERMSE分别为0.09和0.11,EMAPE分别为11.04%和17.26%。经对比可发现无论是在训练集还是测试集,以围岩完整性评价指标体系作为输入特征的PSO-RF模型在围岩完整性预测性能上有了显著提升。方案3在训练集和测试集上的R2分别为0.928 5和0.908 6,ERMSE分别为0.06和0.08,EMAPE分别为9.72%和12.94%。方案3在训练集和测试集上的性能均比方案1的低,说明采用BO算法对RF的部分超参数进行寻优可有效提升模型的预测性能。以上结果表明,本文提出的以围岩完整性评价指标体系作为输入特征的PSO-RF模型在围岩完整性预测上具有显著优越性。

表6
模型的超参数寻优结果
算法超参数最优超参数组合寻优时间/s
RF树的数量2 4461 205.18
最大树深52
寻找最佳分割时要考虑的最大特征数log 2
内部节点再划分所需的最小样本数2
叶子节点所需的最小样本数1
展开更多
表7
隧道围岩Kv预测模型的评估结果
训练方案输入特征训练模型评估指标(训练集)评估指标(测试集)
R2ERMSEEMAPE/%R2ERMSEEMAPE/%
1F1BO-RF0.959 70.026.350.925 40.038.03
2F2BO-RF0.872 90.0911.040.842 50.1117.26
3F1RF0.928 50.069.720.908 60.0812.94
展开更多

通过预测值-实测值散点对角线图系统比较了训练方案1在训练集与测试集上的回归表现及泛化差异,如图10所示,在理想情形下散点应集中分布于45°对角线上。从图10可以看出:无论是训练集还是测试集,基于钻进特征指标所构建的Kv预测模型中的数据点多集中在等值线附近,表明该模型中的预测值和实际值的一致性较好,具有较高预测精度,能够实现现场隧道围岩完整性系数的有效预测。

图10
隧道围岩Kv预测值与真实值对比
pic
3.4 工程验证

根据建立的基于钻进数据定量解译的岩体完整性系数预测方法,结合表3Kv与围岩完整程度的对应关系,即可实现对隧道围岩完整性的评价。鉴于在后续隧道开挖过程中,仅对预测里程的前18 m进行了连续跟踪和地质分析,因此,仅展示18段Kv预测结果,最终预测出隧道围岩的完整性系数Kv图11所示。从图11可以看出:预测里程范围内,围岩完整性系数呈现一定的波动性,完整性系数最大为0.41,最小为0.17,平均值为0.30,岩体完整程度为较破碎到破碎。其中,在0~3 m、9~12 m的深度内,围岩完整性系数不低于0.35,围岩较破碎;在3~9 m、12~18 m深度范围内,围岩完整性系数均在0.15~0.35之间,围岩破碎。

图11
隧道围岩各段落Kv预测结果
pic

为验证隧道围岩完整性随钻判识结果,在后续隧道开挖过程的掌子面进行连续跟踪,图12为钻深18 m范围内不同开挖面的照片。从图12(a)可以看出:钻深3 m和钻深10 m处掌子面的花岗岩整体呈微风化到弱风化,节理裂隙较发育,节理间为强风化,完整程度属于较破碎,现场围岩分级定为Ⅳ级。本文预测该段围岩Kv分别为0.35和0.39,同样为较破碎,预测结果与实际情况同样较相符。从图12(c)可以看出:钻深15 m处掌子面花岗岩呈弱风化,岩石强度较低,另发育密集节理,完整性较差,掌子面呈点滴状出水与线流状出水,伴随掉块及坍塌现象,现场定为Ⅳ级围岩。本文预测该段围岩Kv为0.17左右,为破碎围岩。预测结果与实际结果基本符合。综上可知,本文所提出的隧道围岩完整性随钻识别方法具有有效性,可为现场施工与支护设计提供一定的指导。

图12
隧道开挖后的掌子面照片
pic

本文提出的隧道围岩完整性评价方法在裂隙发育的花岗岩山区铁路隧道中验证效果良好,钻进参数预处理、时频特征解译、RReliefF-Pearson优选、BO-RF预测的流程和思路对其他隧道同样具有可行性。然而,该方法应用于其他工况时主要受两方面约束:首先,模型依赖于钻进参数与岩体完整性之间的统计相关性,当钻机类型、传感器精度或采样频率发生显著变化时,特征分布将偏离训练域,需进行小样本微调或重新训练;其次,在不同工况下,岩石对钻进参数敏感度不同,优选出的完整性预测指标体系可能发生变化。为确保预测精度和工程可靠性,应基于新工程背景重新执行特征优选与后续流程。

4 结论

1) 提出了基于钻进数据定量解译的围岩完整性随钻智能评价方法。在对现场钻进数据进行预处理的基础上,采用时频域分析方法分别提取4种钻进参数的13种时域特征、4种频域特征,随后采用RReliefF算法和Pearson相关系数确定能够反映裂隙围岩完整性的最优钻进指标组合,最后以最优钻进指标组合为输入、对应的围岩完整性系数为输出,结合BO和RF算法建立围岩完整性系数预测模型,实现了围岩完整性随钻智能评价。

2) 基于RReliefF-Pearson特征指标优选方法,获取了用于围岩完整性评价的最优钻进指标组合,包括钻速最大值、钻速最小值、钻速标准差、钻速均方根、钻速平均频率、扭矩平均值、扭矩均方根、扭矩峰值因子、扭矩脉冲因子、扭矩平均频率、钻压峭度、钻压平均频率、转速最大值、转速最小值、转速平均值、转速峭度、转速均方根、转速平均频率,共计18个钻进特征指标。

3) BO-RF预测模型该模型在训练集上的R2为0.959 7,ERMSE为0.02,EMAPE为6.35%,在测试集上的R2为0.925 4,ERMSE为0.03,EMAPE为8.03%,明显优于基线模型,表明该模型具有较强的学习能力和泛化能力,能够实现隧道围岩完整性系数的有效预测。

参考文献
1ZHANG Qi, SHEN Yixin, ZHU Hehua, et al.

Study on comprehensive rating of integrity index Kv for CHN-BQ method based on cloud model

[J]. Tunnelling and Underground Space Technology, 2025, 157: 106305.
百度学术谷歌学术
2谢福君, 张家生, 陈俊桦.

考虑岩体完整程度影响的爆破破裂范围

[J]. 中南大学学报(自然科学版), 2019, 50(6): 1403-1410.
百度学术谷歌学术
3WANG Jinchao, XU Hanhua, CHEN Wei, et al.

Evaluation method for rock mass structure integrity based on borehole multivariate data

[J]. International Journal of Geomechanics, 2022, 22: 04021248.
百度学术谷歌学术
4阳军生, 夏裕栋, 方星桦, .

节理化炭质页岩地层隧道围岩大变形及控制技术研究

[J]. 中南大学学报(自然科学版), 2024, 55(1): 188-200.
百度学术谷歌学术
5陶志刚, 赵易, 丰于翔, .

双向地震作用下跨断层破碎带隧道地震响应动力学试验研究

[J]. 中南大学学报(自然科学版), 2025, 56(2): 637-650.
百度学术谷歌学术
6曹瑞琅, 王玉杰, 赵宇飞, .

基于钻进过程指数定量评价岩体完整性原位试验研究

[J]. 岩土工程学报, 2021, 43(4): 679-687.
百度学术谷歌学术
7LI Yiming, LI Jiale, WU Yuhang, et al.

Extracting rock parameters through digital drilling test

[J]. Rock Mechanics and Rock Engineering, 2024, 57(10): 8215-8241.
百度学术谷歌学术
8夏覃永, 王明年, 孙鸿强, .

基于钻进参数和岩性的钻爆法隧道围岩智能分级模型

[J]. 隧道建设(中英文), 2024, 44(7): 1410-1421.
百度学术谷歌学术
9HE Mingming, WANG Haoteng, MA Chunchi, et al.

Evaluating the anisotropy of drilling mechanical characteristics of rock in the process of digital drilling

[J]. Rock Mechanics and Rock Engineering, 2023, 56(5): 3659-3677.
百度学术谷歌学术
10赵思光, 王明年, 童建军, .

基于钻进参数多变量特征挖掘的隧道围岩智能分级模型研究

[J]. 隧道建设(中英文), 2024, 44(12): 2469-2479.
百度学术谷歌学术
11GAO Hongke, JIANG Bei, MA Fenglin, et al.

Detection methods for strength deterioration and structural characteristics of fractured rock based on digital drilling

[J]. Measurement, 2024, 233: 114779.
百度学术谷歌学术
12岳中琦.

钻孔过程监测(DPM)对工程岩体质量评价方法的完善与提升

[J]. 岩石力学与工程学报, 2014, 33(10): 1977-1996.
百度学术谷歌学术
13AALIZAD S, RASHIDINEJAD F.

Prediction of penetration rate of rotary-percussive drilling using artificial neural networks-a case study

[J]. Archives of Mining Sciences, 2012, 57(3): 715728.
百度学术谷歌学术
14姬付全, 梁晓腾, 邱敏, .

利用随钻测量技术评估岩体结构形态

[J]. 公路交通科技, 2023, 40(1): 144-151.
百度学术谷歌学术
15许明, 刘先珊, 周泽宏, .

旋挖钻机钻进入岩判定与地层识别方法

[J]. 中南大学学报(自然科学版), 2017, 48(12): 3344-3349.
百度学术谷歌学术
16GHOSH R, GUSTAFSON A, SCHUNNESSON H.

Development of a geological model for chargeability assessment of borehole using drill monitoring technique

[J]. International Journal of Rock Mechanics and Mining Sciences, 2018, 109: 9-18.
百度学术谷歌学术
17房昱纬, 吴振君, 盛谦, .

基于超前钻探测试的隧道地层智能识别方法

[J]. 岩土力学, 2020, 41(7): 2494-2503.
百度学术谷歌学术
18梁铭, 彭浩, 解威威, .

基于数字钻探与多尺度模型融合的隧道岩体完整性自动解译技术研究及应用

[J]. 岩土工程学报, 2024, 46(2): 396-405.
百度学术谷歌学术
19徐豹之.

基于多小波分析及证据推理的隧道超前水平钻孔参数预报方法研究

[D]. 西安: 长安大学, 2019: 16-18.
百度学术谷歌学术
20SHI Yunbo, ZHANG Juanjuan, JIAO Jingjing, et al.

Calibration analysis of high-G MEMS accelerometer sensor based on wavelet and wavelet packet denoising

[J]. Sensors, 2021, 21(4): 1231.
百度学术谷歌学术
21刘河清, 刘建康, 郝建, .

随钻信号对岩石单轴抗压强度响应特征及反演模型

[J]. 煤炭科学技术, 2025, 53(4): 266-279.
百度学术谷歌学术
22赵奎, 杨道学, 曾鹏, .

单轴压缩条件下花岗岩声学信号频域特征分析

[J]. 岩土工程学报, 2020, 42(12): 2189-2197.
百度学术谷歌学术
23ASADI A.

Application of artificial neural networks in prediction of uniaxial compressive strength of rocks using well logs and drilling data

[J]. Procedia Engineering, 2017, 191: 279-286.
百度学术谷歌学术
24董立朋, 聂清浩, 孙晓坤, .

基于皮尔逊相关系数法的盾构掘进参数对地表沉降影响分析

[J]. 施工技术(中英文), 2024, 53(1): 116-123.
百度学术谷歌学术
25刘明阳, 陶建峰, 覃程锦, .

基于随机森林与粒子群算法的隧道掘进机操作参数地质类型自适应决策

[J]. 中南大学学报(自然科学版), 2023, 54(4): 1311-1324.
百度学术谷歌学术
26丁昌伟, 王新, 陈同俊, .

贝叶斯优化的XGBoost在 小断层地震解释中的应用

[J]. 煤炭学报, 2023, 48(6): 2530-2539.
百度学术谷歌学术
27李超, 汪磊, 陈洋, .

基于贝叶斯集成学习算法的土体先期固结压力预测模型

[J]. 地球科学, 2023, 48(5): 1780-1792.
百度学术谷歌学术
28方诗圣, 苏一恒, 林彤彤, .

基于机器学习的盾构掘进地表沉降回归预测模型

[J]. 合肥工业大学学报(自然科学版), 2023, 46(9): 1224-1229.
百度学术谷歌学术
29吴禄源, 李建会, 马丹, .

基于集成学习与贝叶斯优化的岩石抗压强度预测

[J]. 地球科学, 2023, 48(5): 1686-1695.
百度学术谷歌学术
30仉文岗, 唐理斌, 陈福勇, .

基于4种超参数优化算法及随机森林模型预测TBM掘进速度

[J]. 应用基础与工程科学学报, 2021, 29(5): 1186-1200.
百度学术谷歌学术
31GB/T 50218—2014. 工程岩体分级标准[S].
注释

亢金涛, 许振浩, 谢辉辉, 等. 基于钻进数据定量解译的隧道围岩完整性评价[J]. 中南大学学报(自然科学版), 2025, 56(9): 3820-3834.

KANG Jintao, XU Zhenhao, XIE Huihui, et al. Integrity evaluation of tunnel surrounding rock based on quantitative interpretation of drilling data[J]. Journal of Central South University(Science and Technology), 2025, 56(9): 3820-3834.

http://dx.doi.org/10.11817/j.issn.1672-7207.2025.09.022