煤层气井产气量预测是进行煤储层产气能力和排采工艺效果综合评价的重要基础,准确度较高的产气量预测能够为合理制定排采制度提供依据,并且也能够为低产井改造后产气效果进行预测,对指导生产具有重要意义[1-3]。传统的煤层气井产量预测方法以煤层气的解吸、扩散、渗流等机理为基础,建立煤层气井流体流动的理论模型,用数值模拟的方法进行产量预测[4-5]。但理论分析常需要基于假设建立模型,加之产能影响因素较多,各因素之间存在着复杂的非线性关系,理论计算结果与实际生产井数据难以匹配[6]。针对上述问题,一些学者基于人工智能算法模型,例如支持向量机(SVM)、随机森林回归模型、BP神经网络模型来分析非线性过程,并广泛应用于煤层气产能预测之中。李艳芳等[7]优选了煤田地震属性,并通过SVM算法模型对煤层气含量进行了预测。朱庆忠等[8]通过随机森林算法的分支优度准则,预测了不同排采方案下的煤层气井日产气量。吕玉民等[9]研究了用于预测煤层气井产气量的BP神经网络模型以及月产量与累计产量之比模型,发现BP神经网络模型对短期预测精度较高,中长期预测能力较差,月产量与累计产量之比模型在中长期产气量预测中拟合度较好。这些基于数据挖掘思想的煤层气产能预测方法都取得了较好的效果。然而利用上述几种模型对数据进行训练时,由于构造的是一种点对点的映射,通过大量数据来完成训练,而忽视了煤层气产量随时间的变化趋势以及产气前后的关联性[10]。
为解决一般的神经网络预测过程中忽略数据的时序性问题,建立了一种基于循环神经网络(RNN)的改进网络:长短期记忆神经网络(long-short term memory neural network,LSTM),并广泛应用于储层孔隙度预测[11]、地球物理勘探[12]以及煤矿工作面瓦斯浓度预测[13]等领域。笔者以沁水盆地南部郑庄区块3号煤层为研究对象,并依托于该区块煤层气井排采资料,从影响煤层气井日产气量的排采因素入手,采用LSTM预测方法,建立煤层气井日产气量预测的LSTM模型,充分考虑排采数据动态变化和前后之间的潜在关系,对煤层气井日产气量进行预测,提供了一种新的煤层气井产气量预测方法。
循环神经网络(Recurrent Neural Network,RNN)相较于BP神经网络、全连接层神经网络具有记忆功能,主要是利用其隐含层单元将先前时刻处理的信息传递给下一个时刻参与计算输出,即一个序列当前的输出与自身的输入有关,还与前一个序列输出也有关[14-15],从而能将日产气量在时间上的关联性考虑进去。
RNN结构及其隐含层单元展开如图1所示。x为输入单元,h为隐含单元,y为输出单元,下角代表各时刻的状态,U、W、V为各层之间的权重矩阵。
图1 RNN结构及其隐含层单元展开
Fig.1 Structure of RNN and expansion of hidden layer units
在RNN中,循环体现在对于t时刻:h(t)在t时刻的表现不仅由此刻的输入xt决定,还受ht-1的影响。此外,参数矩阵W是一个在时间步中被循环共享的矩阵,所以当训练的时间步较大时,W可能会趋于0或无限大,造成梯度消失或爆炸问题,网络最终无法训练,无法实现长时记忆,导致RNN存在短时记忆的问题[16]。
在建立煤层气井日产气量的预测模型时,由于排采井收集到的生产数据是一个较长周期的数据,如果直接使用RNN模型,则会导致传递信息的长期依赖,容易出现梯度消失或爆炸,使得排采数据不能很好得到训练,达不到较好的预测效果。
长短时记忆神经网络(LSTM)能够有效解决信息的长期依赖,避免梯度消失或爆炸[17]。与传统RNN相比,在结构上改进了记忆单元(图2),利用3个门来控制记忆单元的内容,分别是输入门it(Input Gate)、输出门ot(Output Gate)、遗忘门ft(Forget Gate)。输入门控制有多少信息能够传递到当前单元,遗忘门控制上一个序列信息有多少被保留和丢弃,输出门控制当前时刻的信息有多少可以传递到下一个单元中,计算如下
图2 长短时记忆神经网络记忆单元结构
Fig.2 Structure of LSTM memory unit
it=σ(Wi[ht-1,xt]+bi)
(1)
ft=σ(Wf[ht-1,xt]+bf)
(2)
ot=σ(WO[ht-1,xt]+bo)
(3)
式中:σ为Sigmoid激活函数;ht-1为t-1时刻的隐含层状态;xt为t时刻的输入;Wi、Wf、Wo分别为输入层、隐含层和输出层的权重;bi、bf、bo分别为输入层、隐含层、输出层的偏置。
通过3个“门”的计算完成对部分信息的记忆和遗忘。使得LSTM的记忆单元可以在较长一段时间内储存信息,从而解决梯度爆炸或消失问题。研究表明,LSTM对多元时间序列预测问题的表现优于RNN[18-19]。因此,笔者构建LSTM模型对煤层气井排采数据特征进行训练,预测郑庄区块煤层气井日产气量。
影响煤层气井产气量因素较多,大致分为地质因素和工程因素2类,地质因素主要包括煤储层厚度、埋深、含气量、渗透率等,工程因素主要为钻完井过程,压裂过程以及排采过程(其中主要包括对井底流压、液柱高度、套压等参数)。
对排采过程中各项参数的变化情况进行分析,包括井底流压、套压、液柱高度、日产水量、冲次等,在将这些特征因素代入LSTM模型训练之前,对其进行优选,提高神经网络的预测效果。其次,对各项影响因素重要程度排序是一个重要环节,利用随机森林算法挑选出对目标值影响重要的参数能很好地帮助模型训练,防止过拟合。针对已训练好的产气量预测模型,结合优选出对产能影响最大的排采参数,能够更加准确地为后续排采作业提供指导。
煤层气井的产能情况与地质因素和工程因素有关,在地质条件相似的情况下,采用不同的排采制度方案,产能效果也会有一定变化。对研究区郑庄区块Z4-026煤层气井收集到的近1 900 d排采数据进行分析,发现日产气量与排采参数:冲次、套压、井底流压、液柱高度、日产水量有一定的相关性,如图3所示。表现为日产气量与冲次呈正相关性,日产气量与井底流压、套压、液柱高度和日产水量呈负相关性。
1)对煤层气井实施排采方案时,通过控制冲次直接影响排采强度,即主要通过排水降低井底流压,使其降低至临界解吸压力之下,产出煤层气。增大冲次频率,能够加快排水速率,短期增加产气量,但由于煤储层具有流速敏感性、应力敏感性等特征,为了避免储层受到损害,不能连续增大冲次频率。因此冲次与日产气存在正相关关系(图3a)。
2)排采过程中套压直观反映出套管中气体压强状况。排采初期气体未产出,套压为0,随着井底流压降低,气体产出,套压也升高,由于排采初期井底流压较大,使得煤层气产气初期套压也达到最大值,随着排水降压过程的进行,煤层气逐渐产出,井底流压降低,套压也逐渐降低,煤储层中甲烷逐步解吸出来,日产气量增加,因此套压与日产气存在负相关关系(图3b)。
3)液柱高度的变化体现了排采强度,即本质上是为了排水降低储层压力。随着煤层气井中液柱高度的不断降低,储层压力减小,煤层气产量也逐渐增大。因此液柱高度与日产气量存在负相关关系(图3c)。
4)井底流压的控制是排采过程中尤为重要的部分,排采初期煤层气井产气时间主要取决于井底流压何时能降低至煤储层临界解吸压力之下,井底流压不断降低,使煤层气产量不断增大。因此井底流压与日产气存在负相关关系(图3d)。
5)日产水量主要与排采制度以及水文地质条件相关,排采初期产水量较大,日产气量并未达到最高值,随着排采的进行,排采井底从单相水流逐渐向气水两相流过渡,产出水量逐步降低,气体大量产出。因此日产水量与日产气存在负相关关系(图3e)。
图3 日产气量与排采参数之间关系
Fig.3 Relationship between daily gas production and exhaust production parameters
基于上述分析得到日产气量与冲次、套压、井底流压、液柱高度、日产水量等排采参数有一定的相关性,为进一步优选参数,依据皮尔逊相关系数计算方法见式(4),得到排采参数之间的相关程度见表1。
表1 排采参数之间的相关系数
Table 1 Correlation coefficient between drainage parameters
参数冲次套压井底流压液柱高度日产水量冲次1.00套压0.711.00井底流压0.711.001.00液柱高度0.250.080.101.00日产水量0.490.660.670.671.00
(4)
式中:r为相关系数;xi为第i个排采参数值,为排采参数平均值;yi为第i个排采参数对应的日产气量,为日产气量平均值。
根据排采参数之间相关分析结果,套压与井底流压之间相关性达到了1,但由于在神经网络模型中套压对日产气量的影响与井底流压对日产气量的影响不同,并且实际生产中套压反映的是煤层气井套管中气体压力情况,井底流压则包括井底上方的液柱压力和气体压力,需要区别分析。因此将套压和井底流压保留作为输入特征。另外,通过参数间相关性也能发现液柱高度只与日产水量相关性较高。日产水量与其余参数之间也具有较强的相关性,除了液柱高度外,冲次与其他参数相关性也较高。这也为排采参数的优化提供了依据。
由于上述过程分析日产气量与排采参数之间的关系是一个线性过程,并且只能分析两两参数之间的相关程度。但排采过程中多参数求解日产气量是一个非线性的过程,影响日产气量的参数有多个。为进一步分析每个输入参数在模型中对日产气量的贡献率,从而优选输入参数,增加模型准确性。通过随机森林算法特有的特征重要性方法进行自适应数据研究,在井底流压、套压、液柱高度、日产水量、冲次5个参数中分析影响日产气量最重要的参数。
随机森林是一种集成算法,优化了不相关决策树的袋装集成,通过投票进行分类和预测。在随机森林框架中,将每个特征因素在随机森林中的每棵决策树上做的贡献取平均值,通过对比每个特征对目标的贡献来衡量其重要性[20]。通常将随机样本被分错的概率用基尼指数G表示,将特征重要性评分用V表示。
(5)
式中:Va为第a个特征在所有特征参数中的重要性;m、t、k分别是排采参数特征总数、单棵树的节点总数、分类树总棵数;Gapj为第a个特征在第j棵树的第p个节点的基尼指数。
以Z4-026井为例,选取排采过程中井底流压、套压、液柱高度、日产水量、冲次因素作为输入特征,日产气量作为目标值,利用随机森林算法对排采过程中5个参数进行特征重要性评价。利用sklearn.ensemble导入RandomForestClassifier模块。得到特征重要性见表2。排采参数对产气量的重要性排序为:井底流压>液柱高度>套压>日产水量>冲次。
表2 特征重要性占比
Table 2 Feature importance ratio
排采参数井底流压液柱高度套压日产水量冲次占比0.380.330.180.100.01
结合排采参数之间的相关性分析,对煤层气井日产气量的合理控制应从井底流压、液柱高度、套压3个重要参数入手。实际生产过程中应根据不同排采阶段合理调节冲次频率,并考虑生产井的日产水量情况对井底流压、套压、液柱高度进行合理控制。
通过分析日产气量与排采参数的相关性以及特征重要性占比,井底流压、液柱高度、套压是模型训练的重要参数,日产水量、冲次与其他排采参数之间有较强的相关性,并且冲次作为制定排采制度的首要控制参数,需要保留。日产水量则反映了排采过程中煤储层水文地质条件的动态变化,同样需要代入模型中。因此,将井底流压、套压、液柱高度、日产水量、冲次5个参数都作为输入变量。
笔者利用Python3.7编写程序,使用第三方库Tensorflow、Keras深度学习框架,根据排采生产数据集构建排采参数与日产气量的时间序列,实现对日产气量的预测。
郑庄区块位于沁水盆地南部,主采煤层3、15号煤层,排采井目标煤层主要为3号煤层,埋深650~1 010 m,平均埋深805 m,煤层平均厚度为5.3 m。该煤镜质体最大反射率为3.27%~3.98%,为无烟煤。煤体结构以原生结构煤、碎裂煤为主,少量发育碎粒煤[21]。煤的平均含气量为19.34 m3/t,孔隙度为3.4%~6.5%。煤层渗透率为(0.3~0.5)×10-3 μm2。综合评价3号煤储层煤质较好,含气性很高但渗透率较差[22]。
选取郑庄区块Z4-026煤层气井2012年8月至2017年7月间的排采生产数据作为数据集。其中2012年8月至2017年2月作为训练集进行模型学习训练,2017年3月至2017年7月作为验证集检验模型预测的准确性。模型输入参数为:井底流压、套压、液柱高度、日产水量、冲次,输出参数为日产气量。
接下来将每个参数数据进行z-score标准化,经过处理的数据符合标准正态分布,转换函数为
s*=(s-μ)/δ
(6)
式中:s*为标准化处理后的数据;s为原始样本数据;μ、δ分别为原始数据的均值和标准差。
在确定模型输入、输出参数后,由于LSTM模型需要将训练数据重塑为样本数目、时间步长、参数数目的三维数据。经过调试和搜索,最终选取时间步长为3。模型采用3层神经网络对产气量拟合,经过训练拟合,决定将每层神经元数量都设置为25,激活函数选用ReLU激活函数,优化器选择Rmsprop优化算法,为防止训练时网络数量过多造成数据过拟合,循环网络中常采用Dropout方法,即按照一定的概率将神经网络单元暂时从网络中丢弃,训练次数为400次,批量大小为15,损失函数采用均方误差(MSE)。
利用LSTM模型进行训练,如图4所示,损失函数在训练集和验证集上都不断下降,模型训练得到的拟合值和训练集样本中的实际产气值的平均相对误差为2.49%。模型训练后的日产气量拟合值与实际产气量对比如图5所示,二者得到的日产气量曲线都体现了同样的趋势,说明LSTM模型所建立的煤层气产气量与实际产气量拟合程度很好。
图4 模型训练集和验证集损失函数下降曲线
Fig.4 Decline curve of loss function of model training set and validation set
图5 Z4-026井日产气量实际值与拟合值对比
Fig.5 Comparison of actual and fitted gas output of well Z4-026
将训练好的LSTM神经网络模型用于预测Z4-026井2017年7月未来60 d的产气量,将输入参数井底流压、套压、液柱高度、日产水量、冲次代入模型后输出日产气量,反归一化后得到预测产气量值,模型的实际值与预测值的平均误差为2.04%,并且最高误差为3.97%,误差都在5%之下,预测效果很好。
利用支持向量机(SVM)回归模型、随机森林模型以及BP神经网络对Z4-026井排采数据进行训练,同样预测未来60 d的产气情况(图6)。模型LSTM模型预测效果最好,在关键性的产气量高、低点能较好地符合实际情况,对排采工程的计划具有重要意义。4种预测模型中BP神经网络和支持向量机回归模型拟合效果一般(表3)。随机森林回归模型误差相对较小,LSTM模型的相对误差平均值最小。可见在考虑数据的前后关系以及“门”的设置后,增强了LSTM模型的预测效果。
图6 4种机器学习方法日产气量实际值与拟合值对比
Fig.6 Comparison of actual and fitted daily gas output of four machine learning methods
表3 4种机器学习方法预测日产气量效果对比
Table 3 Comparison of four machine learning methods to predict daily gas production output
模型平均产气量/m3实际预测平均相对误差/%LSTM模型1 524.151 555.172.04BP模型1 524.151 639.257.55支持向量机回归模型1 524.151 638.707.53随机森林回归模型1 524.151 599.254.94
除了对Z4-026煤层气井进行预测以外,选取该地区平均日产气量高于1 000 m3的井(Z4-030、Z4-046)、平均日产气量为500~1 000 m3的井(Z4-023)、平均日产气量低于500 m3的井(Z4-031、Z4-033),预测未来30 d的日产气量情况,从而进一步验证LSTM神经网络模型的适用性,预测结果见表4。
表4 煤层气井实际产量与模型预测产量
Table 4 Actual production of CBM well and predicted production by model
井号平均产气量/m3实际预测平均相对误差/%Z4-0301 359.631 347.833.12Z4-0461 290.771 259.908.68Z4-023647.37596.838.02Z4-031356.63335.405.97Z4-033425.77426.572.09
根据郑庄区块其余5口煤层气井的预测结果可以看出LSTM模型的预测结果与实测值之间误差小,相对误差平均值都小于10%。
1)郑庄区块煤层气井排采参数之间具有一定相关性,且煤层气井日产气量与冲次呈正相关性。日产气量与井底流压、套压、液柱高度和日产水量呈负相关性。
2)煤层气井排采参数对日产气量影响程度表现为:井底流压>液柱高度>套压>日产水量>冲次。结合相关性分析结果,排采过程中控制日产气量应该优先控制井底流压、液柱高度和套压的变化情况,合理制定冲次频率。
3)综合考虑井底流压、液柱高度、套压、冲次、日产水量参数的动态变化,以及数据前后关联,基于长短时记忆神经网络模型(LSTM)对Z4-026煤层气井日产气量进行拟合并预测分析表明,LSTM模型预测精度较高,为煤层气井产气量预测和制定合理的排采制度提供了有效途径。
[1] 孔 鹏,李忠城,杨晨曦,等.基于PCA-NB方法的煤层气井压后产量预测研究[J].特种油气藏,2019,26(6):108-112.
KONG Peng,LI Zhongcheng,YANG Chenxi,et al.Research on production prediction of coalbed methane Wells after compression based on PCA-NB method[J].Special Oil and Gas Reservoirs,2019,26(6):108-112.
[2] 王志荣,杨 杰,陈玲霞,等.水力压裂条件下焦作矿区低渗煤层气试验井产能预测[J].煤田地质与勘探,2019,47(3):70-76.
WANG Zhirong,YANG Jie,CHEN Lingxia,et al.Productivity prediction of low-permeability coalbe dmethane test well in Jiaozuo mining area under hydraulic fracturing[J].Coal Geology & Exploration,2019,47(3):70-76.
[3] 王 衍,马俯波,李小军,等.鄂东低煤阶U型井排采特征及产气量预测研究[J].中国煤炭地质,2018,30(8):29-35.
WANG Yan,MA Fubo,LI Xiaojun,et al.Study on drainage characteristics and gas production prediction of U-shaped well with low coal rank in eastern Hubei Province[J].Coal Geology of China,2018,30(8):29-35.
[4] WANG Yan,MAN Zhongshui.Numerical simulation of coalbed methane-water two-phase flow and prediction of coalbed methane productivity based on finite volume method[J].International Journal of Heat and Technology,2019,37(4):975-984.
[5] 吕玉民,汤达祯,许 浩,等.沁南盆地樊庄煤层气田早期生产特征及主控因素[J].煤炭学报,2012,37(S2):401-406.
LYU Yumin,TANG Dazhen,XU Hao,et al.Early production characteristics and main controlling factors of coalbed methane field in Fanzhuang,Qinnan Basin[J].Journal of China Coal Society,2012,37(S2):401-406.
[6] 张艳玉,孙晓飞,尚凡杰,等.沁水煤层气井产能预测及其影响因素研究[J].石油天然气学报,2012,34(11):118-122.
ZHANG Yanyu,SUN Xiaofei,SHANG Fanjie,et al.Study on productivity prediction and influencing factors of coalbed methane Wells in Qinshui Basin[J].Journal of Oil and Gas Technology,2012,34(11):118-122.
[7] 李艳芳,程建远,王 成.基于支持向量机的地震属性优选及煤层气预测[J].煤田地质与勘探,2012,40(6):75-78.
LI Yanfang,CHENG Jianyuan,WANG Cheng.Seismic attribute optimization and coalbed methane prediction based on support vector machine[J].Coal Geology & Exploration,2012,40(6):75-78.
[8] 朱庆忠,胡秋嘉,杜海为,等.基于随机森林算法的煤层气直井产气量模型[J].煤炭学报,2020,45(8):2846-2855.
ZHU Qingzhong,HU Qiujia,DU Haiwei,et al.Gas production model of CBM vertical well based on random forest algorithm[J].Journal of China Coal Society,2020,45(8):2846-2855.
[9] 吕玉民,汤达祯,李治平,等.煤层气井动态产能拟合与预测模型[J].煤炭学报,2011,36(9):1481-1485.
LYU Yumin,TANG Dazhen,LI Zhiping,et al.Simulation and prediction model of dynamic productivity of coalbed methane wells[J].Journal of China Coal Society,2011,36(9):1481-1485.
[10] 侯春华.基于长短期记忆神经网络的油田新井产油量预测方法[J].油气地质与采收率,2019,26(3):105-110.
HOU Chunhua.Oil production prediction method of new oil well based on long and short-term memory neural network[J].Petroleum Geology and Recovery Efficiency,2019,26(3):105-110.
[11] 王 俊,曹俊兴,周 欣.基于深度双向循环神经网络的储层孔隙度预测[J].地球物理学进展,2021,41(11):1-10.
WANG Jun,CAO Junxing,ZHOU Xin.Prediction of reservoir porosity based on deep bidirectional circulating neural network[J].Progress in Geophysics,2021,41(11):1-10.
[12] DAVID O,OLALERE O,SUNDAY A,et al.Dynamic data driven sonic well log model for formation evaluation[J].Journal of Petroleum Science and Engineering,2019,175(4):1049-1062.
[13] 李树刚,马 莉,潘少波,等.基于循环神经网络的煤矿工作面瓦斯浓度预测模型研究[J].煤炭科学技术,2020,48(1):33-38.
LI Shugang,MA Li,PAN Shaobo,et al.Research on prediction model of gas concentration in coal mine working face based on cyclic neural network[J].Coal Science and Technology,2020,48(1):33-38.
[14] WEERAKODY P B,WONG K W,WANG G,et al.A review of irregular time series data handling with gated recurrent neural network[J].Neurocomputing,2021,441(7):161-178.
[15] ALEX S.Fundamentals of recurrent neural network(RNN)and long short-term memory(LSTM)network[J].Physica D:Nonlinear Phenomena,2020,404(11):1294-1322.
[16] 朱剑兵,王兴谋,冯德永,等.基于双向循环神经网络的河流相储层预测方法及应用[J].石油物探,2020,59(2):250-257.
ZHU Jianbing,WANG Xingmou,FENG Deyong,et al.A method for fluvial reservoir prediction based on bidirectional circulating neural network and its application[J].Geophysical Prospecting for Petroleum,2020,59(2):250-257.
[17] ESKANDARI H,IMANI M,MOGHADDA M P.Convolutional and recurrent neural network based model for short-term load forecasting[J].Electric Power Systems Research,2021,195(9):652-666.
[18] 王洪亮,穆龙新,时付更,等.基于循环神经网络的油田特高含水期产量预测方法[J].石油勘探与开发,2020,47(5):1009-1015.
WANG Hongliang,MU Longxin,SHI Fugeng,et al.Prediction method of oil field production in ultra-high water-cut stage based on cyclic neural network[J].Petroleum Exploration and Development,2020,47(5):1009-1015.
[19] 安 鹏,曹丹平,赵宝银,等.基于LSTM循环神经网络的储层物性参数预测方法研究[J].地球物理学进展,2019,34(5):1849-1858.
AN Peng,CAO Danping,ZHAO Baoyin,et al.Research on reservoir physical property parameter prediction method based on LSTM cyclic neural network[J].Progress in Geophysics,2019,34(5):1849-1858.
[20] 温廷新,张 波.露天煤矿边坡稳定性的随机森林预测模型[J].科技导报,2014,32(Z1):105-109.
WEN Tingxin,ZHANG Bo.Random forest prediction model for slope stability of open pit coal mine[J].Science and Technology Review,2014,32(Z1):105-109.
[21] 冯树仁,张 聪,张建国,等.沁水盆地南部郑庄区块高煤阶煤层气成藏模式[J].天然气地球科学,2021,32(1):136-144.
FENG Shuren,ZHANG Cong,ZHANG Jianguo,et al.Study on the coalbed methane accumulation model of high coal rank in zhengzhuang block,Southern Qinshui Basin[J].Natural Gas Geoscience,201,32(1):136-144.
[22] 信 凯,季长江,魏若飞.晋城矿区郑庄深部煤层L型水平井增产改造技术[J].煤,2021,30(4):13-15.
XIN Kai,JI Changjiang,WEI Ruofei.The stimulation technology of L-shaped horizontal well in deep coal seam of Zhengzhuang in Jincheng mining area[J].Coal,2021,30(4):13-15.