移动扫码阅读
煤炭资源是我国的基础能源和重要原料,在能源消耗结构中占据重要地位[1]。煤炭资源的大规模开采会对地表建(构)筑物造成破坏,也会对生态环境产生严重影响[2]。因此,煤矿开采过程中的地表沉陷预测极其重要。
地表下沉系数是表征开采沉陷和地表移动规律的重要参数,也是进行地表移动和变形预测时的关键参数,其取值的准确性将直接影响沉陷预测结果的精度[3-4]。影响地表下沉系数的因素很多,因素间的不确定性及非线性关系使得下沉系数的预测工作极其困难,依靠地表观测站数据的实测下沉值或水平移动值反演地表下沉系数的方法耗时费力,不适合长期发展[5-6]。近些年来,随着人工智能算法的发展,越来越多的学者利用随机森林算法、遗传算法和支持向量机等模型进行地表下沉系数预测。彭杰帅等[7]利用随机森林算法不易出现过拟合的优势进行了地表下沉系数预测,王拂晓等[8]将遗传算法与广义回归神经网络相融合,建立了GA-GRNN的地表下沉系数预测模型,于宁峰等[9]建立了基于PSO优化参数的SVM预测模型实现地表下沉系数的预测分析。这些方法都是利用一种或几种算法的优势对地表下沉系数预测进行有益探索,具有一定的适用性。
笔者借助BP神经网络较强的非线性映射能力进行地表下沉系数预测,考虑到地表下沉系数的影响因素较多且因素间存在相关性,提出通过组合权重来确定主要影响因素,进而实现BP神经网络输入参数的预处理与模型简化。利用地表实测数据对由主要影响因素建立的BP神经网络预测模型进行了验证,得到了较高的预测效果,是地表下沉系数预测的又一种有效方法。
主成分分析法(简称PCA)是常用的基础数学分析方法,其在数学建模、动力学模拟和数理统计等领域应用广泛。在众多领域的研究中,大量变量之间的相关性增加了问题研究的复杂性,因此考虑利用较少的不相关变量代替各个变量中的各种信息,主成分分析就是这样一种数据降维方法。PCA在能够保留大部分原始数据信息的情况下,将N维特征映射到K维上(N>K),从而起到降低数据维数的作用[10]。
有N维数据集Xi,构造线性组合Y=AX,则主成分分析的数学模型[11]如下:
(1)
式中,Y为主成分;X为原始变量;a为主成分系数。Yi和Yj线性无关且ai1+ai2+…+aiN=1。
地表下沉系数影响因素众多,例如釆深、采厚、采宽、留宽、煤层倾角、覆岩岩性等[12]。受限于各个矿区资料收集的差异性,这里仅仅对国内35个矿区的开采厚度、煤层倾角、平均釆深、走向宽深比、倾向宽深比、推进速度、松散层厚度和覆岩平均坚固系数进行研究[13-14],部分样本数据见表1,其信息描述见表2。
表1 矿区实测数据
Table 1 Measured data of mining area
矿区下沉系数开采厚度/m煤层倾角/(°)平均釆深/m走向宽深比倾向宽深比推进速度/(m·月-1)松散层厚度/m覆岩平均坚固系数矿区10.661.0967.53.631.4227.58.13.50矿区20.621.67476.383.40308.13.50矿区30.671.610318.50.880.79302.73.10矿区40.642.13060.56.581.9845103.20︙︙︙︙︙︙︙︙︙︙矿区310.761.58812.591.01303.23.10矿区320.911.4122010.720.884544.56矿区330.848.24.33254.860.49971971.30矿区340.838.544270.362.971101942.20矿区350.602.4279.31.130.814570.80
表2 数据统计
Table 2 Data statistics
影响因素开采厚度/m煤层倾角/(°)平均釆深/m走向宽深比倾向宽深比推进速度/(m·月-1)松散层厚度/m覆岩平均坚固系数下沉系数极小值0.9202.00030.5000.3600.46013.00000.5200.600极大值8.50043.000427.0006.5806.070150.000197.0009.8400.960均值2.97514.351155.8112.6481.54752.60338.0193.6190.767标准差2.20511.32196.9841.8951.28330.30350.2441.6580.105
利用SPSS20软件,对影响地表下沉系数的8个因素进行主成分分析。由软件计算得到的KMO>0.5和Sig<0.05可知(KMO和Sig为主成分分析的适用性),可以对选取的8个因素进行主成分分析。根据累计方差贡献率大于80%的原则选取主成分,由表3可得,提取5个主成分,其方差贡献率分别为36.503%,20.350%,11.091%,10.565%和9.768%,累计方差贡献率达到88.276%。根据主成分系数与方差贡献率可确定各因素的综合系数,再将各因素的综合系数进行归一化处理,最后可以得到各个因素的权重[15],见表4。
表3 方差解释
Table 3 Variance interpretation
主成分特征值方差占比/%累积占比/%12.92036.50336.50321.62820.35056.85330.88711.09167.94440.84510.56578.50850.7819.76888.27660.4175.21493.49170.3244.04597.53680.1972.464100
表4 主成分系数与因素权值
Table 4 Principal component coefficient and factor weight
影响因素主成分1主成分2主成分3主成分4主成分5PCA权重开采厚度0.695-0.3460.231-0.3570.3050.130煤层倾角-0.622-0.0820.3340.5420.3090.075平均釆深0.805-0.2160.0190.383-0.1070.156走向宽深比-0.4360.6080.381-0.3440.2910.098倾向宽深比0.1870.722-0.4200.3000.3100.157推进速度0.7300.337-0.242-0.1420.2070.163松散层厚度0.7600.0990.4850.2190.1750.205覆岩平均坚固系数-0.259-0.664-0.326-0.0340.5720.016
灰色关联度分析法(简称GRA)是灰色系统理论(我国著名学者邓聚龙教授于1982年提出)的一个重要分支,也是数据分析中常用的方法。灰色关联度分析的基本方法是根据比较数列集所构成的曲线与参考数列集所构成的曲线的相似程度来判断其关系是否密切,曲线形状越是相近,越说明相应数据系列关系越紧密[16-17]。该方法对样本数量的多少和样本规律性要求不够,且计算量小,不会出现反常情况。目前,灰色关联度分析法已成功应用到工程控制和农业经济等方面,都取得了不错的效果。
灰色关联度分析法确定权重的主要步骤如下[18-19]:
1)进行灰色关联分析时,首先要确定参考数列和比较数列,参考数列反映系统的行为特征,而比较数列是由影响系统行为特征的因素组成。
(2)
式中:为参考数列;为比较数列,其中i=1,2,…,M。
2)系统中各因素代表不同的物理意义,有着不同的量纲,而量纲的不同会导致最终的结论出错。因此,需要对数据进行无量纲化处理,将其归一到一个近似区域内,常用的处理方法有均值法和初值法。采用均值法进行数据处理的方式如下:
(3)
式中:Xi为无量纲化处理后的数列;为各个数列的均值,其中i=0,1,2,…,M。
3)计算比较数列与参考数列对应因素的关联系数。
ξ(x0(k),xi(k))=
(4)
式中:i取值为1,…,M;k取值为1,…,N;ρ为分辨系数,反映关联系数间的差异性,通常取值为0.5。
4)计算关联度r(X0,Xi)。
(5)
5)根据关联度可得影响因素权重Wi。
(6)
以地表下沉系数为参考数列,以影响因素为比较数列,按照灰色关联度分析确定因素权重的步骤,对国内35个矿区的8个影响因素进行定权。由Matlab编程计算得到:开采厚度、煤层倾角、平均釆深、走向宽深比、倾向宽深比、推进速度、松散层厚度和覆岩平均坚固系数的灰色关联度分别为0.815,0.776,0.824,0.788,0.788,0.847,0.746和0.874;则各因素对应的权重为0.126,0.120,0.128,0.122,0.122,0.131,0.116和0.135。
经主成分分析法定权和灰色关联度分析法定权后,各个影响因素的PCA权重和GRA权重见表5。根据参考文献[20]可知,由主成分分析法和灰色关联度分析法确定权重的公式如下所示:
W=0.5WP+0.5WG
(7)
式中,WP和WG分别为影响因素的PCA权重和GRA权重。
各影响因素的组合权重见表5。由组合权重可知,各影响因素对地表下沉系数的影响程度为:松散层厚度>推进速度>平均釆深>倾向宽深比>开采厚度>走向宽深比>煤层倾角>覆岩平均坚固系数。以权重大于0.13为主要影响因素的选取原则,选取松散层厚度、推进速度、平均釆深和倾向宽深比为主要影响因素。
表5 影响因素组合权重
Table 5 Combination weight of influencing factors
影响因素PCA权重GRA权重组合权重开采厚度0.1300.1260.128煤层倾角0.0750.1200.097平均釆深0.1560.1280.142走向宽深比0.0980.1220.110倾向宽深比0.1570.1220.140推进速度0.1630.1310.147松散层厚度0.2050.1160.160覆岩平均坚固系数0.0160.1350.076
BP神经网络是神经网络模型中应用最为广泛的模型之一,是一种信息前向传递、误差反向传播的多层前馈网络。它能够在数据间建立输入与输出的非线性映射关系,进而完成数据预测。研究证明,一个简单的3层BP神经网络就可以以任意精度与任意连续函数相拟合[21],3层BP神经网络包括输入层、隐含层和输出层。
1)参数选取与数据预处理。以表1中的前32组数据作为训练样本进行网络训练,以后3组数据作为预测样本进行精度评价。以影响地表下沉系数的主要影响因素松散层厚度、推进速度、平均釆深和倾向宽深比为输入参数,以地表下沉系数为输出参数,建立4—N—1结构的BP神经网络模型,简称为W-BP模型。对于隐层节点N的选取,通过参考各种文献确定节点N的大致范围,然后经过“试凑法”进行多次训练[22-23],分析实际模拟效果,最终确定N值为6。为使预测结果更为精确,在进行网络训练前,需要对数据进行归一化处理,消除数据间的数量级差别,并能够有效减小激活函数的函数误差,这里采用Matlab里的premnmx函数进行归一化处理。
2)网络参数与函数的设置。BP神经网络的激活函数(传递函数)能够引入非线性因素,进而解决线性模型无法解决的问题。因此,不同的激活函数会对预测效果产生不同的影响,借鉴以往研究成果,隐含层的激活函数选择S型正切函数tansig,输出层的激活函数选择线性函数purelin。学习训练函数和权重学习函数分别设为traingdx和learngdm,学习率设为0.01,训练目标误差为10-5。
为更好地分析W-BP神经网络的预测效果,将其与传统BP神经网络(输入参数为8个参数)作对比。 在完成网络训练与仿真模拟后,通过分析预测值与实测值间的误差大小来检验模型的预测效果。误差对比见表6。
表6 误差对比
Table 6 Error comparison
模型误差类型样本1样本2样本3均值BP绝对误差/%4.2242.5124.554—相对误差/%5.0283.0267.5905.215W-BP绝对误差/%-5.555-6.9183.954—相对误差/%6.6138.3346.5907.179
由表6可知,2种模型的绝对误差都小于7%,与实测值有着较好的拟合效果,但传统BP神经网络模型的整体拟合效果要优于W-BP模型。传统BP神经模型的平均相对误差为5.215%,W-BP模型的平均相对误差为7.179%,从相对误差对比可以发现,2种模型依然能够产生较好的预测效果,但传统BP神经网络模型的预测效果仍然优于W-BP模型。经分析可知,基于组合权重得到的主要影响因素虽然简化了BP神经网络模型,但缺失了部分信息,导致最终的预测精度低于传统BP神经网络模型。W-BP模型的绝对误差最大值为-6.918%,相对误差最大值为8.334%,能够满足基本工程需要,是地表下沉系数预计的一种可行方法。
1)利用主成分分析与灰色关联度分析相结合的方法求取地表下沉系数影响因素的组合权重,由组合权重分析各因素对地表下沉系数的影响程度,得到主要影响因素为松散层厚度、推进速度、平均釆深和倾向宽深比。
2)选取的主要影响因素实现了BP神经网络模型的简化,由绝对误差和相对误差对比分析可知,由主要影响因素建立的地表下沉系数BP预测模型有着较好的预测效果,其绝对误差最小值为3.954%,最大值仅为-6.918%,平均相对误差为7.179%。分析表明,该模型能够应用到地表下沉系数预测,是一种可行的方法。
3)地表下沉系数的实测数据比较缺乏,导致样本数量较少,预测模型的精度在一定程度上会受样本数量的影响。随着智慧型数字化矿山的发展,更多的实测资料会得到收集利用,该模型的精度会有进一步的提升空间。
[1] 钱鸣高,许家林,王家臣.再论煤炭的科学开采[J].煤炭学报,2018,43(1):1-13.
QIAN Minggao,XU Jialin,WANG Jiachen. Further on the sustainable mining of coal [J]. Journal of China Coal Society,2018,43(1):1-13.
[2] 赵开功,李彦平.我国煤炭资源安全现状分析及发展研究[J].煤炭工程,2018,50(10):185-189.
ZHAO kaigong,LI Yanping. Analysis and development suggestion for coal resources safety in China [J]. Coal Engineering,2018,50(10):185-189.
[3] 郭文兵,邓喀中,邹友峰.地表下沉系数计算的人工神经网络方法研究[J].岩土工程学报,2003,25(2):212-215.
GUO Wenbing,DENG Kazhong,ZOU Youfeng. Study on artificial neural network method for calculation of subsidence coefficient [J]. Chinese Journal of Geotechnical Engineering,2003,25(2):212-215.
[4] 李青海,张存智,李开鑫,等.巨厚松散层下开采地表下沉的影响因素分析[J].煤炭科学技术,2021,49(11):191-199.
LI Qinghai,ZHANG Cunzhi,LI Kaixin,et al.Analysis of influence of different parameters of mining under super-thick loose layer on surface subsidence[J].Coal Science and Technology,2021,49(11):191-199.
[5] 胡炳南,郭文砚.我国采煤沉陷区建筑利用关键技术及其发展方向[J].煤炭科学技术,2021,49(4):67-74.
HU Bingnan,GUOWenyan.Key technologies and development directions of building utilization in coal mining subsidence areas in China[J].Coal Science and Technology,2021,49(4):67-74.
[6] 张 飞,刘文生,霍志国,等.地表下沉系数选取的LWPSO-BP方法研究[J].测绘科学,2011,36(6):128-130.
ZHANG Fei,LIU Wensheng,HUO Zhiguo,et al. Study on LWPSO-BP method for selection of surface subsidence coefficient [J]. Science of Surveying and Mapping,2011,36(6):128-130.
[7] 彭杰帅,宋文杰,邓仁贵.基于随机森林算法的地表下沉系数预测研究[J].湖南有色金属,2018,34(4):1-3.
PENG Jieshuai,SONG Wenjie,DENG Rengui. Study on surface subsidence coefficient prediction based on random forest algorithm [J]. Hunan Nonferrous Metals,2018,34(4):1-3.
[8] 王拂晓,谭志祥,邓喀中.基于GA-GRNN的地表下沉系数预测方法研究[J].煤炭工程,2014,46(7):94-96.
WANG Fuxiao,TAN Zhixiang,DENG Kazhong. Study on prediction method of surface subsidence coefficient based on GA-GRNN [J]. Coal Engineering,2014,46(7):94-96.
[9] 于宁锋,杨化超,邓喀中,等.基于PSO和SVM的矿区地表下沉系数预测[J].辽宁工程技术大学学报(自然科学版),2008,27(3):365-367.
YU Ningfeng,YANG Huachao,DENG Kazhong,et al. Calculation of surface subsidence coefficient in mining areas using support vector machine regression [J]. Journal of Liaoning Technical University(Natural Science),2008,27(3):365-367.
[10] 施龙青,张荣遨,韩 进,等.基于GWO改进的PCA-BP神经网络煤层底板破坏深度预测模型[J].矿业研究与开发,2020,40(2):88-93.
SHI Longqing,ZHANG Rongao,HAN Jin,et al. Prediction model of failure depth of coal seam floor based on PCA-BP neural network improved by GWO [J]. Mining Research and Development,2020,40(2):88-93.
[11] 钱兆明,任高峰,褚夫蛟,等.基于PCA法和Fisher判别分析法的岩体质量等级分类[J].岩土力学,2016,37(S2):427-432,441.
QIAN Zhaoming,REN Gaofeng,CHU Fujiao,et al. Rock mass quality classification based on PCA and Fisher discrimination analysis [J]. Rock and Soil Mechanics,2016,37(S2):427-432,441.
[12] 胡炳南,袁 亮.条带开采沉陷主控因素分析及设计对策[J].煤矿开采,2000,5(4):24-27,4.
HU Bingnan,YUAN Liang. Analysis of the main influence factors of subsidence due to strip mining and the optimization design [J]. Coal Mining Technology,2000,5(4):24-27,4.
[13] 国家煤炭局.建筑物、水体、铁路及主要井巷煤柱留设与压煤开采规程[M].北京:煤炭工业出版社,2000:121-200.
State Coal Administration. Rules for coal pillar reservation and coal pressure mining in buildings,water bodies,railways and main shafts [M]. Beijing:Coal Industry Press,2000:121-200.
[14] 吕伟才,黄 晖,池深深,等.概率积分预计参数的神经网络优化算法[J].测绘科学,2019,44(9):35-41.
LYU Weicai,HUANG Hui,CHI Shenshen,et al. Neural network optimization algorithm for the prediction parameters of probability integral method [J]. Science of Surveying and Mapping,2019,44(9):35-41.
[15] 周 洋,侯淑婧,宗 科.基于主成分分析方法的生态经济效益评价[J].统计与决策,2018,34(1):66-69.
ZHOU Yang,HOU Shujing,ZONG Ke. Evaluation of ecological and economic benefits based on principal component analysis [J]. Statistics & Decision,2018,34(1):66-69.
[16] 郭文砚,胡炳南,范明宇,等.淮南矿区地表下沉系数主控因素分析与回归计算[J].中国煤炭,2018,44(6):46-50,69.
GUO Wenyan,HU Bingnan,FAN Mingyu,et al. Analysis and regression calculation of main controlling factors of surface subsidence coefficient in Huainan mining area [J]. China Coal,2018,44(6):46-50,69.
[17] 赵忠明,施天威,董 伟,等.灰色关联分析与BP神经网络的概率积分法参数预测[J].测绘科学,2017,42(7):36-40,51.
ZHAO Zhongming,SHI Tianwei,DONG Wei,et al. The prediction of probability-integral method parameters based on grey relational analysis and BP neural network [J]. Science of Surveying and Mapping,2017,42(7):36-40,51.
[18] 黄曦涛,张 瑜,赵绍兵,等.西安市城市内涝模拟与损失灰色关联度研究[J].测绘通报,2019,65(9):62-67.
HUANG Xitao,ZHANG Yu,ZHAO Shaobing,et al. Study on urban interior simulation and grey correlation degree of simulation and loss in Xi’an City [J]. Bulletin of Surveying and Mapping,2019,65(9):62-67.
[19] 钱吴永,党耀国,熊萍萍,等.基于灰色关联定权的TOPSIS法及其应用[J].系统工程,2009,27(8):124-126.
QIAN Wuyong,DANG Yaoguo,XIONG Pingping,et al. Topsis based on grey correlation method and its application [J]. Systems Engineering,2009,27(8):124-126.
[20] 鲍学英,李海连,王起才.基于灰色关联分析和主成分分析组合权重的确定方法研究[J].数学的实践与认识,2016,46(9):129-134.
BAO Xueying,LI Hailian,WANG Qicai. Study on the determination method of combined weight based on grey correlation analysis and principal component analysis [J]. Mathematics in Practice and Theory,2016,46(9):129-134.
[21] 李辉东,关德新,袁凤辉,等. BP人工神经网络模拟杨树林冠蒸腾[J].生态学报,2015,35(12):4137-4145.
LI Huidong,GUAN Dexin,YUAN Fenghui,et al. Modeling canopy transpiration of young poplar trees( Populus × euramericana cv. N3016) based on back propagation artificial neural network [J]. Acta Ecologica Sinica,2015,35(12):4137-4145.
[22] 李地红,高 群,夏 娴,等.基于BP神经网络的混凝土综合性能预测[J].材料导报,2019,33(S2):317-320.
LI Dihong,GAO Qun,XIA Xian,et al. Prediction of comprehensive performance of concrete based on BP neural network [J]. Materials Reports,2019,33(S2):317-320.
[23] 张 兵,赵玉玲,崔希民,等. 基于优化时间函数的采动地表任意点沉陷动态预计[J]. 煤炭科学技术,2020,48(10):143-149.
ZHANG Bing,ZHAO Yuling, CUI Ximin,et al. Dynamic prediction of mining-induced subsidence for any surface point based on optimized time function[J]. Coal Science and Technology,2020,48(10):143-149.