高级检索

基于SSA−LSTM的风速异常波动检测方法

邓立军, 袁金波, 刘剑, 尚文天

邓立军,袁金波,刘 剑,等. 基于SSA−LSTM的风速异常波动检测方法[J]. 煤炭科学技术,2024,52(3):139−147. DOI: 10.12438/cst.2023-0463
引用本文: 邓立军,袁金波,刘 剑,等. 基于SSA−LSTM的风速异常波动检测方法[J]. 煤炭科学技术,2024,52(3):139−147. DOI: 10.12438/cst.2023-0463
DENG Lijun,YUAN Jinbo,LIU Jian,et al. Detection method of wind speed anomaly fluctuation based on SSA−LSTM[J]. Coal Science and Technology,2024,52(3):139−147. DOI: 10.12438/cst.2023-0463
Citation: DENG Lijun,YUAN Jinbo,LIU Jian,et al. Detection method of wind speed anomaly fluctuation based on SSA−LSTM[J]. Coal Science and Technology,2024,52(3):139−147. DOI: 10.12438/cst.2023-0463

基于SSA−LSTM的风速异常波动检测方法

基金项目: 

国家自然科学基金资助项目(51904143)

详细信息
    作者简介:

    邓立军: (1985—),男,湖北京山人,副教授,博士。E-mail:anheihb03dlj@163.com

  • 中图分类号: TD723; TP18

Detection method of wind speed anomaly fluctuation based on SSA−LSTM

Funds: 

National Natural Science Foundation of China (51904143)

  • 摘要:

    针对传统统计方法对风门开闭导致传感器监测数据异常波动的漏报率和误报率高的问题,通过挖掘风速传感器中时间序列数据中的数据特征,提出了一种基于奇异谱分析法(SSA)与长短期记忆神经网络(LSTM)组合的SSA−LSTM风速异常波动检测方法。首先利用SSA对风速传感器监测数据进行预处理,将风速数据分解为趋势分量、周期分量和噪声分量,通过重组趋势分量和噪声分量去除因湍流脉动产生的数据噪声;然后对LSTM进行参数优化,利用优化后的LSTM模型对预处理数据进行预测并得到重构风速;最后以对数概率密度函数计算监测风速与重构风速的异常分数,通过计算训练集数据样本的异常分数设定阈值对监测风速进行异常检测。试验结果表明:SSA去除因湍流脉动产生的数据噪声效果较好,在不影响数据波动情况下去除噪声分量,有助于提高风速重构效果和异常检测准确率;LSTM在无异常波动时能正确重构因湍流脉动导致的小幅波且与实际数据拟合效果较好,在有异常波动时根据历史波动趋势对异常波动段进行重构,可有效提高异常检测的准确率。通过对比分析,所提方法比ARIMA、BP、CNN模型的重构效果更好,异常检测准确率为99.2%,F1-Score为0.97,验证了所提方法的可靠性。表明本文所提方法在检测因风门开闭导致的风速异常波动上具有一定的应用价值。

    Abstract:

    Aiming at the problem of high leakage rate and false alarm rate of traditional statistical methods for abnormal fluctuation in sensor monitoring data caused by dampers opening and closing, a SSA-LSTM wind speed abnormal fluctuation detection method based on the combination of Singular Spectrum Analysis (SSA) and Long and Short-Term Memory Neural Network (LSTM) was proposed by mining the data features in the time-series data in the wind speed sensors. Firstly, SSA was used to pre-process the wind speed sensor monitoring data, and the wind speed data was decomposed into trend component, periodic component and noise component. The data noise generated by turbulent pulsation was removed via reorganizing the trend component and noise component. The LSTM parameters was then optimized, and the optimized LSTM model was used to predict the pre-processed data and obtain the reconstructed wind speed. Finally, the anomaly fraction of the monitored wind speed and reconstructed wind speed was calculated by using the logarithmic probability density function. Anomaly detection for monitoring wind speed was performed by calculating the threshold set value of training set data samples. The experimental results shown that, the removing effect for the data noise generated by turbulence pulsation via SSA was better. Removing the noise component without affecting the data fluctuation was helpful in improving the wind speed reconstruction effect and the anomaly detection accuracy. LSTM can correctly reconstruct the small amplitude wave due to turbulence pulsation without anomalous fluctuation and fits well with the actual data. The reconstruction of abnormal fluctuation segment based on historical fluctuation trend when there was abnormal fluctuation can effectively improve the accuracy of anomaly detection. Through comparative analysis, the reconstruction effect of proposed method in this paper was better than ARIMA, BP and CNN models, with an anomaly detection accuracy of 99.2% and an F1-Score of 0.97, which verified the reliability of the proposed method. The method proposed in the paper has important application value in detecting the abnormal fluctuation of wind speed caused by the opening and closing of dampers.

  • 风门开闭会引起通风系统及关联巷道风流发生波动。当风门处于静止状态(保持关闭或保持敞开),即无扰动条件下,风速传感器监测数据在湍流脉动作用下呈现无周期、非线性的小幅度波动[1]。而在风门开闭过程中,关联巷道风速传感器监测数据会出现短时异常波动。由于湍流脉动的作用,风速传感器监测数据存在大量噪声,传统统计方法无法精确检测风速传感器监测数据中的异常波动,存在漏报率和误报率高的问题,给预警与控制带来较大困难,因此需尽早检测风速异常波动。风速传感器监测数据可视为一类非线性、非平稳时间序列数据。为尽可能地提取时间序列数据中的有效信息,排除噪声干扰,有学者将时间序列数据分解成具有不同时间尺度的若干分量,并对单一分量进行分析和重组,从而实现噪声分离[2]。目前常用的时间序列数据降噪方法——傅里叶变换(Fourier Transform,FT)、小波分析(Wavelet Analysis,WA)、经验模态分解(Empirical Mode Decomposition,EMD)和SSA(Singular Spectrum Analysis,SSA)等均对时间序列数据有着较好的降噪作用。然而,傅里叶变换只适用于平稳的数据分析,在处理非平稳数据时有着一定的局限性[3];小波分析降噪过程中,虽能对非平稳数据进行分解,但其小波基、分解层和小波阈值等相关参数受人为影响因素较多,容易出现偏差[4];EMD可根据原始数据本身特征将数据分解为多个本征模态分量,实现了数据的自适应分解,被广泛应用于数据降噪领域,但由于EMD在分解过程中极易出现模态混叠以及端点效应,在一定程度上影响了EMD的降噪效果[5];SSA可有效规避以上问题,因其具备不需要复杂先验信息的数据处理优势,成为了解析优化非线性时序数据十分有效的技术手段[6-7]

    为深度挖掘时间序列数据内在关联关系及数据特征,在时间序列异常检测领域大量学者针对深度学习方法进行研究及应用[8]。邓华伟等[9]利用随机森林提取网络流量数据特征,构建LSTM(Long Short Term Memory,LSTM)神经网络模型,实现网络流量异常检测。龚向阳等[10]提出一种基于深度残差LSTM的视频异常行为识别算法,将登杆作业的多个视频序列作为输入数据,通过深度残差网络获得多个视频序列的特征,进一步将融合后的特征作为LSTM网络输入,实现登杆作业异常行为的识别。蔡兴旭等[11]提出基于LSTM的桥梁传感器异常检测方法,通过小波变换与奇异谱分析对传感器数据进行预处理,基于贝叶斯优化算法以及LSTM构建时间序列异常检测模型,最终通过学习异常报警阈值实现潜在异常检测。田亮等[12]提出了基于数据驱动的故障诊断方法,通过LSTM神经网络的预测能力和证据理论的多源信息融合能力来对引风机轴承的状态进行诊断。除LSTM以外,ARIMA、BP、CNN等方法也可用于时间序列数据异常检测。但ARIMA很难用来挖掘时间序列数据之间的非线性关系,预测精度较差[13]。BP网络对波动性较强的时间序列数据预测效果较低且泛化能力较弱[14-15]。CNN的池化层会丢失大量有价值的信息,降低局部与整体的相关性[16]

    综上所述,SSA方法能够较好的分离非线性时间序列数据中的噪声,LSTM方法对时间序列数据有着较好的预测效果且泛化能力强,笔者提出一种基于SSA−LSTM的风速异常波动检测方法。首先采用SSA对原始风速数据序列进行重组,分离湍流脉动噪声,然后利用LSTM对SSA重组后的风速序列数据进行重构,最后利用对数概率密度函数计算原始数据与LSTM重构数据的异常分数,并拟定异常报警阈值,从而实现风速传感器监测数据中的异常波动检测[17]

    风速传感器监测数据中由于湍流脉动作用存在大量噪声,为去除这部分噪声,提高异常检测性能,引入SSA方法。SSA是一种处理非线性时间序列数据的方法,通过对所要研究的时间序列进行嵌入、分解、分组、重组4个步骤处理,提取主要趋势成分,以达到降噪的目的。主要步骤如下:

    1)嵌入:将一维时间序列$ [{x_1},{x_2}, \cdots, {x_n}] $以长度为l的时间窗口进行映射,形成k个长度为l的向量,其中k=nl+1,组成的轨迹矩阵[18]如下:

    $$ \boldsymbol{X}=\left[ \begin{array}{cccc} x_1 & x_2 & \cdots & x_k \\ x_2 & x_3 & \cdots & x_{k+1} \\ \vdots & \vdots & & \vdots \\ x_l & x_{l+1} & \cdots & x_n \end{array} \right] $$ (1)

    2)分解:对得到的轨迹矩阵进行奇异值分解(SVD):

    $$ \boldsymbol{X}\text{ = }\sum\limits_{i=1}^d\lambda_i\boldsymbol{U}_i\boldsymbol{V}_i^{\mathrm{\mathit{\mathrm{T}}}} $$ (2)

    式中:d为非零奇异值的数量,$ d = {\mathrm{rank}}({{\boldsymbol{X}}}) \leqslant \min (l,m) $;$ {{{\boldsymbol{U}}}_i} $、$ \mathit{\boldsymbol{V}_{\mathit{i}}} $为$ {{\boldsymbol{X}}} $的左右奇异向量。

    3)分组:为去除数据中多余的噪点,若数据$ {X} $的组成是由有用信号$ {{\boldsymbol{S}}} $和噪声$ {{\boldsymbol{E}}} $组成,即$ {{\boldsymbol{X}}}{\text{ = }}{{\boldsymbol{S}}} + {{\boldsymbol{E}}} $,分组是为了尽可能将$ {{\boldsymbol{E}}} $部分去除。前r个较大的奇异值组成的数据即可被认为是有用数据,则d−r部分则为噪声部分,因此,选择合适的r值即可实现数据和噪声分离的效果。

    4)重组:重组是利用对角平均化将上述分组得到的矩阵转化成所需的长度为n的重构序列RC。令$ {{\boldsymbol{Y}}} \in {R_{l \times k}} $代表分组后得到的任一矩阵,$ {{{y}}_{ij}} $$ (1 \leqslant i \leqslant l,1 \leqslant j \leqslant k) $为矩阵中的各元素。设$ {l^{\text{*}}}{\text{ = }}\min (l,k) $,$ {k^*} = \max (l,k) $,当$ l < k $时,$ {{y}}_{ij}^* = {y_{ij}} $,否则,$ {{y}}_{ij}^* = {y_{ji}} $。那么通过对角平均化可以将矩阵$ {{\boldsymbol{Y}}} $变换成所需的长度为n的序列$ {y}_{r{c}_{1}},{y}_{r{c}_{2}},\cdots, {y}_{r{c}_{n}} $,相关计算公式如下:

    $$ {y}_{{rc}_{{k}}} \begin{cases}\dfrac{1}{k} \displaystyle\sum_{m=1}^k y_{m, k-m+1}^*, & (1 \leqslant {k} \leqslant l^* )\\ \dfrac{1}{l^*} \displaystyle\sum_{m=1}^{L^*} y_{m, k-m+1}^*, & (l^* \leqslant {k}\leqslant k^* )\\ \dfrac{1}{n-k+1} \displaystyle\sum_{m=k-k^*+1}^{n-k^*+1} y_{m, k-m+1}^*, & (k^* \leqslant {k} \leqslant n)\end{cases} $$ (3)

    式中:$ {{{y}}_{{{r}}{{{c}}_{{k}}}}} $为第k个经对角平均化转化的序列。

    LSTM神经网络是RNN神经网络的改进版,除继承了RNN的结构类型外,新建遗忘门对输入的数据信息进行选择性遗忘,有效地避免了隐藏层权重在迭代多次后出现梯度消失或梯度爆炸的情况的发生[19]

    LSTM神经网络继承了RNN的结构类型外,增加了门的思维来对参数进行筛选,其中遗忘门决定了将多少上一时刻的细胞状态$ {c_{t - 1}} $保留下来;输入门决定了将当前输入$ {x_t} $是否保留至当前细胞状态$ {c_t} $中,避免不重要的记忆信息进入细胞;输出门决定传入下一时刻的输出信息,如图1所示。

    图  1  LSTM单元结构
    Figure  1.  LSTM unit structure

    图1中,将sigmoid和tanh函数作为激活函数,遗忘门、输入门、输出门将传入的信息受权重矩阵和偏置向量的影响,将得到新的输出矩阵和新的细胞状态,主要公式如下:

    $$ \begin{cases}\text { 遗忘门: } & f_t=\sigma\left(W_f \left[h_{t-1}, x_t\right]+b_{{i}}\right) \\ \text { 输入门: } & i_t=\sigma\left(W_i \left[h_{t-1}, x_t\right]+b_f\right) \\ & {g}_t=\tan {\mathrm{h}} \left(W_c \left[h_{t-1}, x_t\right]+{b}_c\right) \\ & c_t=f_t c_{t-1}+i_t {g}_t \\ \text { 输出门: } & {o}_t=\sigma\left(W_o \left[h_{t-1}, x_t\right]+b_o\right) \\ & c_t=f_t c_{t-1}+i_t {g}_t\end{cases}$$ (4)

    式中:$ {f_t} $为遗忘门;$ {i_t} $为输入门;$ {g_t} $为细胞状态的输入;$ {o_t} $为输出门;$ {c_{t - 1}} $和$ {c_t} $为上一时刻和当前时刻的细胞状态;$ {h_{t - 1}} $和$ {h_t} $为上一时刻和当前时刻的输出;$ {W_f} $,$ {W_i} $,$ {W_c} $,$ {W_o} $和$ {b_i} $,$ {b_f} $,$ {b_c} $,$ {b_o} $分别为LSTM三个门不同状态下的权重矩阵和偏置向量。

    SSA−LSTM风速异常波动检测方法可分为预处理、LSTM风速重构和风速异常波动检测3部分,主要流程如图2所示。

    图  2  风速异常波动检测
    Figure  2.  Wind speed abnormal fluctuation detection

    采用SSA可将风速传感器监测数据分解为趋势分量、周期分量和噪声分量,再重构趋势分量和周期分量,以达到去除数据中存在的噪声的目的。

    构建LSTM风速重构模型,该模型分为3个部分:输入层、隐藏层和输出层。首先输入层主要对原始风速监测数据进行预处理和数据集划分;然后基于隐藏层对训练集进行训练,通过Adam优化算法对LSTM神经网络权值进行更新,不断调整网络层数得到最优网络结构,并添加Dropout层防止过拟合;最后,输出层根据隐藏层中训练的模型进行预测,得到重构风速。

    重构风速误差是t−1之前的历史数据对t时刻风速预测值与t时刻实际风速的差值,计算该误差的对数概率密度作为异常分数,并设定阈值$ \tau $用于判定异常风速:异常分数在阈值以下,则该点出现异常,否则正常。为减少异常检测误判,阈值$ \tau $取训练集异常分数最小值。异常分数计算公式如公式(5)所示,异常分数越小,t时刻风速属于异常波动区间概率越大[20]

    $$ \left\{ \begin{gathered} {{{y}}_t} = \left| {{x_t} - {{x'}_t}} \right| \\ f({y_{{t}}},\mu ,\sigma ) = \lg \left[ {\frac{1}{{\sqrt {2\pi } \sigma }}\exp \left( { - \frac{{{{\left( {{y_t} - \mu } \right)}^2}}}{{2{\sigma ^2}}}} \right)} \right] \\ \end{gathered} \right. $$ (5)

    式中:$ {x_t} $为t时刻的实际风速;$ {x'_t} $为基于t−1之前的历史数据对t时刻的风速预测值;$ {y_t} $为t时刻的预测误差;$ \mu $为数据样本风速均值,$ \sigma $表示数据样本风速标准差。

    为验证方法的有效性,试验数据来源课题组前期的风门开闭风流扰动试验[21]。试验装置满足几何相似与动力相似,整体相似比为1∶16。设定入口风速为8 m/s,在风门串联巷道、风门所在巷道迎风侧、风门所在巷道通风侧、风门并联巷道布置4个风速测点。试验参数包括开闭角度、风门开闭速度、风门敞开时间3个变量,构成96种工况,共得到4 000组无扰动(风门保持关闭或敞开)风速监测数据以及120组有扰动(风门开闭动态过程)风速监测数据。

    风门开闭时间分别为t1=30 s,t2=50 s,风门开闭过程中,风门所在巷道及前后巷道风流会产生“向上”的异常波动;并联巷道风流会产生“向下”的异常波动,如图3所示。

    图  3  风门所在巷道和并联巷道风速波动
    Figure  3.  Air velocity fluctuations of air tunnel and parallel tunnel

    由于不同巷道的风速不同,在预处理之前需将不同的风速时间序列数据进行滑移处理。取某一段序列数据的无扰动区域风速均值作为基准线,计算其它段序列的无扰动区域风速均值与基准线的差值,将序列段垂直滑移到基准线。

    基于前文所述SSA方法对数据样本进行降噪处理,分解出的趋势分量、周期分量、噪声分量及贡献率如图4所示。

    图  4  数据分量及贡献率
    Figure  4.  Data component and contribution rate

    图4可知,湍流脉动产生的噪声其贡献率占比很小,不足1%,周期分量和趋势分量可以反映整体的风速波动情况,因此可以将噪声分量去除。

    利用SSA方法将趋势分量和周期分量进行重构,重构前后结果如图5所示,SSA方法可以很好地剔除原始风速数据中的湍流脉动噪声,以更光滑的曲线保留整体的风速波动情况。

    图  5  SSA降噪与原始数据拟合
    Figure  5.  SSA noise reduction and real data fitting figure

    为评估SSA方法的降噪性能,本文选取传统的滑动平均法(Moving Average,MA)和小波分析法(Wavelet Analysis,WA)与SSA方法进行对比,对比结果如图6图7所示。

    图  6  WA降噪与原始数据拟合
    Figure  6.  WA noise reduction and real data fitting figure
    图  7  MA降噪与原始数据拟合效果
    Figure  7.  MA noise reduction and real data fitting figure

    图6可知,小波降噪法虽然对原始风速数据起到了一定的降噪效果,但是却丢失了过多的趋势细节信息;滑动平均降噪因其窗口大小不同,会致使数据结果向后进行滑移,误差较大,如图7所示。最后,选用信噪比(Signal Noise Ratio,SNR)和皮尔逊相关系数(Pearson Correlation Coefficient,PCC)对SSA、MA、WA后的数据进行评估。在两个评价指标中,SNR越大,代表降噪效果越好;PCC值越接近1,代表曲线与原曲线拟合效果越好。公式如下:

    $$ {\mathrm{SNR}}{\text{ = }}10\lg \frac{{\displaystyle\sum\limits_{t = 1}^n {{x_{t}^2}} }}{{\displaystyle\sum\limits_{t = 1}^n {{{\left( {{y_t} - {x_t}} \right)}^2}} }} $$ (6)

    式中:$ {x_{{t}}} $为t时刻实际风速值;$ {y_{{t}}} $为t时刻降噪后的风速值。

    $$ {\mathrm{PCC}} = \frac{1}{{n - 1}}\sum\limits_{{{t}} = 1}^n {\left( {\frac{{{x_t} - {\mu _x}}}{{{\sigma _x}}}} \right)} \left( {\frac{{{y_t} - {\mu _y}}}{{{\sigma _y}}}} \right) $$ (7)

    式中:$ {\mu _x} $为实际风速值的均值;$ {\sigma _x} $为实际风速值的标准差;$ {\mu _y} $为降噪后的风速均值;$ {\sigma _y} $为降噪后的风速标准差,计算结果见表1

    表  1  降噪方法评价对比
    Table  1.  Evaluation comparison of noise reduction methods
    降噪方法PCCSNR
    SSA0.987175.12
    WA0.854269.12
    MA0.636966.72
    下载: 导出CSV 
    | 显示表格

    从结果上看,利用SSA对数据降噪后的信噪比为75.12,线性相关系数为0.9871,降噪能力都优于MA和WA。

    采用深度学习库Keras构建LSTM风速重构模型,后端采用基于C++开发的TensorFlow-GPU开源框架。将数据按照一定比例进行划分,其中4 000组无扰动风速数据作为训练集样本,120组有扰动风速数据作为测试集样本。LSTM模型构建时对比不同层数下的预测效果,选取合适的隐藏层层数,确定模型相关参数,其中神经元个数为64,步长为10,学习率为0.01,Dropout的比例为0.5。

    理论上LSTM隐藏层层数越多,预测数据曲线拟合能力越强。但层数增多,神经网络结构越来越复杂,训练时间越来越长,容易出现过拟合现象,泛化能力变差。分别比较了隐层数为1、2、3、4时LSTM的预测效果,结果如图8表2所示。

    图  8  不同LSTM隐层预测效果
    Figure  8.  Different LSTM prediction effects

    图8中,单层LSTM预测结果与实际值偏差较大;二、三、四层LSTM在无扰动区域预测结果与实际值均较吻合,但在有扰动区域,三、四层LSTM出现过拟合现象,有扰动区域风速预测结果与实际值过于接近,而二层LSTM具有良好的区分效果。随着层数的增加,LSTM模型训练时间也会增加,但误差并没有显著下降。综合考虑,二层LSTM模型预测效果是最优的。

    表  2  训练时间以及预测误差
    Table  2.  Training time and prediction error
    LSTM层数 训练时间/s 预测误差
    1 65 0.0553
    2 77 0.0162
    3 107 0.0163
    4 165 0.0165
    下载: 导出CSV 
    | 显示表格

    计算训练集实际风速与LSTM重构风速的误差,依据式(5)计算训练集中每个风速对应的异常分数,计算结果如图9所示。取异常分数最小值作为阈值$ \tau $。

    图  9  重构误差与异常分数曲线
    Figure  9.  Reconstruction error and anomaly score curves

    当风门处于静止状态(保持关闭或保持敞开),风速传感器监测数据在8.5~9.5 m/s范围内波动,风门开闭过程中,风门所在巷道及前后巷道风速会增大,产生“向上”的风速异常波动。如图10所示,在30~50 s时,风门开闭,风速超出正常波动范围,最大风速达到了12.8 m/s,属于异常波动范围。选取风门所在巷道风速监测数据中的测试集序列,将预处理后的序列数据进行LSTM风速重构,LSTM在30~50 s是能根据历史风速波动数据信息重构正确的风速波动趋势。计算重构误差的异常分数,以上文设定的阈值$ \tau $进行异常检测。使用斜线填充将小于阈值的风速数据时间区间进行标记,小于阈值的时间风速区间范围为31~50 s,与实际风门开闭时间区间接近,证明了所提方法的可行性。

    图  10  风门巷道异常划分
    Figure  10.  Air door tunnel anomaly division

    风门开闭过程中,风门并联巷道会减小,产生“向下”的风速异常波动。如图11所示,风速正常波动8.5~9.5 m/s内上下波动时属于正常风速数据,但在30~50 s时,风门开闭时,风速偏离正常波动范围,最小风速达到了6.5 m/s,属于异常波动范围。

    图  11  并联巷道异常划分
    Figure  11.  Parallel tunnel anomaly division

    为验证方法的风速重构效果及异常检测的准确率,以SSA-ARIMA、SSA-CNN和SSA-BP模型进行比较,各模型均采用与SSA−LSTM模型相同的数据集,如图12图13所示。

    图  12  不同模型重构效果
    Figure  12.  Different model reconstruction effects
    图  13  其他各模型异常检测
    Figure  13.  Anomaly detection figure for other models

    1)重构效果对比分析。不同模型的风速重构效果如图12所示,在10~30 s的正常风速波动段中,巷道风流受湍流脉动的影响出现了小幅的风速波动,SSA-BP与SSA-CNN模型重构数据波动趋势较为平稳,无法对因湍流脉动导致的小幅风速波动数据进行正确拟合;SSA−LSTM和SSA-ARIMA模型重构曲线与实际风速曲线接近,表明二者对正常风速段中的小幅湍流脉动可正确重构。在30~50 s的异常风速波动段中,风门开闭,风速波动趋势发生大幅波动,SSA-ARIMA模型重构数据与实际异常波动数据接近,出现过拟合现象;SSA-BP、SSA-CNN和SSA−LSTM模型重构数据波动趋势较为平稳,对异常风速波动进行逆重构效果较好。在60~100 s的正常风速波动段中,巷道风流受湍流脉动影响较小且无风门开闭等影响风流改变的现象出现,风速波动较为平稳,各模型重构曲线与实际风速曲线拟合良好。SSA−LSTM模型能正确重构因湍流脉动导致的小幅波动风速数据,也能对异常风速数据进行逆重构,在4个模型中重构能力最好。

    2)异常检测效果对比分析。以准确率和F1-Score为评价指标对不同模型进行评价分析。准确率表示模型重构正确的数据样本占整体风速数据样本的比重;F1-Score是精确率和召回率的调和平均,可以较为全面地评价模型的异常检测效果,F1-Score越大说明模型检测效果越好,结果见表3

    表  3  不同模型异常检测评价指标
    Table  3.  Evaluation metrics for anomaly detection in different models
    模型 准确率/% F1-Score/%
    SSA−ARIMA 85.7 49
    SSA−LSTM 99.2 97
    SSA−BP 92.4 82
    SSA-CNN 89.9 75
    下载: 导出CSV 
    | 显示表格

    SSA−ARIMA模型异常检测精度较差,误将13、14、23 s时刻的风速检测为异常风速,仅正确识别出了38%的风速异常波动数据;SSA−BP与SSA−CNN模型异常检测精度接近,但均误将因湍流脉动导致的小幅波动识别为异常风速波动;SSA−LSTM模型不仅正确识别出异常波动区间,且当风速出现小幅波动时具有较好的鲁棒性,相较于其他模型,本文所提模型表现最优,异常检测的准确率和F1-Score分别达到了99.2%和97%。

    1)SSA方法可以将风速传感器监测数据序列中的趋势分量、周期分量和噪声分量有效分离,提高信噪比,能够有效去除因湍流脉动产生的数据噪声,去噪效果明显,有助于提高风速重构效果和异常检测准确率。

    2)当监测数据无异常波动时,SSA−LSTM模型能够捕捉风速监测传感器数据中的隐藏特征,能根据历史风速波动数据信息重构正确的无异常风速波动趋势;当监测数据出现异常波动时,利用对数概率密度函数计算实际风速与SSA−LSTM模型重构风速的异常得分,取异常分数最小值作为阈值,根据阈值检测监测数据是否属于异常风速。

    3)SSA−LSTM模型相对于SSA-BP、SSA-CNN、SSA-ARIMA模型明显具有更优的重构效果和异常检测准确率,能正确重构因湍流脉动导致的小幅波动风速数据,进而提高了异常检测的准确率。经验证该模型的检测准确率和F1-Score指标也优于其它模型。

    4)由于矿井生产活动复杂,导致风流出现异常波动的因素可能还包括罐笼提升、矿车运行等,出现异常波动的规律、趋势也有一定的差别,因此在矿井风流异常检测研究中,多因素、多特征的风速异常检测可为下一步的研究目标。

  • 图  1   LSTM单元结构

    Figure  1.   LSTM unit structure

    图  2   风速异常波动检测

    Figure  2.   Wind speed abnormal fluctuation detection

    图  3   风门所在巷道和并联巷道风速波动

    Figure  3.   Air velocity fluctuations of air tunnel and parallel tunnel

    图  4   数据分量及贡献率

    Figure  4.   Data component and contribution rate

    图  5   SSA降噪与原始数据拟合

    Figure  5.   SSA noise reduction and real data fitting figure

    图  6   WA降噪与原始数据拟合

    Figure  6.   WA noise reduction and real data fitting figure

    图  7   MA降噪与原始数据拟合效果

    Figure  7.   MA noise reduction and real data fitting figure

    图  8   不同LSTM隐层预测效果

    Figure  8.   Different LSTM prediction effects

    图  9   重构误差与异常分数曲线

    Figure  9.   Reconstruction error and anomaly score curves

    图  10   风门巷道异常划分

    Figure  10.   Air door tunnel anomaly division

    图  11   并联巷道异常划分

    Figure  11.   Parallel tunnel anomaly division

    图  12   不同模型重构效果

    Figure  12.   Different model reconstruction effects

    图  13   其他各模型异常检测

    Figure  13.   Anomaly detection figure for other models

    表  1   降噪方法评价对比

    Table  1   Evaluation comparison of noise reduction methods

    降噪方法PCCSNR
    SSA0.987175.12
    WA0.854269.12
    MA0.636966.72
    下载: 导出CSV

    表  2   训练时间以及预测误差

    Table  2   Training time and prediction error

    LSTM层数 训练时间/s 预测误差
    1 65 0.0553
    2 77 0.0162
    3 107 0.0163
    4 165 0.0165
    下载: 导出CSV

    表  3   不同模型异常检测评价指标

    Table  3   Evaluation metrics for anomaly detection in different models

    模型 准确率/% F1-Score/%
    SSA−ARIMA 85.7 49
    SSA−LSTM 99.2 97
    SSA−BP 92.4 82
    SSA-CNN 89.9 75
    下载: 导出CSV
  • [1] 刘 剑,郭 欣,邓立军,等. 基于风量特征的矿井通风系统阻变型单故障源诊断[J]. 煤炭学报,2018,43(1):143−149.

    LIU Jian,GUO Xin,DENG Lijun,et al. Resistance variant single fault source diagnosis of mine ventilation system based on air volume characteristic[J]. Journal of China Coal Society,2018,43(1):143−149.

    [2] 魏 林,白天亮,付 华,等. 基于EMD-LSSVM的瓦斯浓度动态预测模型[J]. 安全与环境学报,2016,16(2):119−123.

    WEI Lin,BAI Tianliang,FU Hua,et al. New gas concentration dynamic prediction model based on the EMD-LSSVM[J]. Journal of Safety and Environment,2016,16(2):119−123.

    [3] 郭 超,陈 蓥. 矿山震动信号预处理及其对时频的影响[J]. 煤炭学报,2016,41(7):1859−1865.

    GUO Chao,CHEN Ying. Filtering technique for mining vibration signals and its affection on the signals’ time-frequency characteristics[J]. Journal of China Coal Society,2016,41(7):1859−1865.

    [4] 戴前伟,丁 浩,张 华,等. 基于变分模态分解和奇异谱分析的GPR信号去噪[J]. 吉林大学学报(地球科学版),2022,52(3):701−712.

    DAI Qianwei,DING Hao,ZHANG Hua,et al. Noise reduction method of GPR signal based on VMD-SSA[J]. Journal of Jilin University(Earth Science Edition),2022,52(3):701−712.

    [5] 张杏莉,卢新明,贾瑞生,等. 基于变分模态分解及能量熵的微震信号降噪方法[J]. 煤炭学报,2018,43(2):356−363.

    ZHANG Xingli,LU Xinming,JIA Ruisheng,et al. Micro-seismic signal denoising method based on variational mode decomposition and energy entropy[J]. Journal of China Coal Society,2018,43(2):356−363

    [6] 周兰庭,邓思源,柳志坤,等. 基于SSA−LSTM-GF的混凝土坝变形分析预测方法[J]. 河海大学学报(自然科学版),2023,51(2):73−80,149.

    ZHOU Lanting,DENG Siyuan,LIU Zhikun,et al. Deformation analysis and prediction method of concrete dam based on SSA−LSTM-GF[J]. Journal of Hohai University(Natural Sciences),2023,51(2):73−80,149.

    [7] 陈 越,刘雄英,任子良,等. 基于相空间重构和奇异谱分析的混沌信号降噪[J]. 华南理工大学学报(自然科学版),2018,46(3):58−64,91.

    CHEN Yue,LIU Xiongying,REN Ziliang,et al. Noise reduction of chaotic signals based on phasespace reconstruction and singular spectrum analysis[J]. Journal of South China University of Technology( Natural Science Edition),2018,46(3):58−64,91.

    [8] 董维强,孟召平,沈 振,等. 基于循环神经网络的煤层气井产气量预测方法研究[J]. 煤炭科学技术,2021,49(9):176−183.

    DONG Weiqiang,MENG Zhaoping,SHEN Zhen,et al. Research on coalbed methane well gas production forecast method based on cyclic neural network[J]. Coal Science and Technology,2021,49(9):176−183.

    [9] 邓华伟,李喜旺. 基于深度学习的网络流量异常识别与检测[J]. 计算机系统应用,2023,32(2):274−280.

    DENG Huawei,LI Xiwang. Abnormal network flow identification and detection based on deep learning[J]. Computer Systems & Applications,2023,32(2):274−280.

    [10] 龚向阳,杨跃平,张明达,等. 基于深度残差LSTM的视频异常行为识别算法[J]. 电子设计工程,2022,30(19):164−168.

    GONG Xiangyang,YANG Yueping,ZHANG Mingda,et al. Video abnormal behavior recognition algorithm based on depth residual and Long Short-Term Memory network[J]. Electronic Design Engineering,2022,30(19):164−168.

    [11] 蔡兴旭,刘以安,肖 颖. 基于改进LSTM的桥梁传感器异常数据的检测方法[J]. 计算技术与自动化,2021,40(2):8−11,20.

    CAI Xinxu,LIU Yian,XIAO Ying. Detection method of bridge sensor abnormal data based on improved LSTM[J]. Computing Technology and Automation,2021,40(2):8−11,20.

    [12] 田 亮,袁存波. 基于LSTM和证据理论的引风机轴承故障诊断[J]. 动力工程学报,2023,43(5):614−621.

    TIAN Liang,YUAN Cunbo. Fault diagnosis of induced draft fan bearing based on LSTM and evidence theory[J]. Journal of Chinese Society of Power Engineering,2023,43(5):614−621.

    [13] 吴慧军,郭超雨,苏承国,等. 基于EEMD-GRU-MC的短期风功率组合预测方法[J]. 南方电网技术,2023,17(2):66−73.

    WU Huijun,GUO Chaoyu,SU Chengguo,et al. Combined prediction method for short-term wind power based on EEMD-GRU-MC[J]. Southern Power System Technology,2023,17(2):66−73.

    [14] 邹文进,郝少飞,马 刚,等. 基于CEEMD-GA-BP神经网络的风光发电功率预测[J]. 电网与清洁能源,2022,38(3):111−118.

    ZOU Wenjin,HAO Shaofei,MA Gang,et al. Forecast of wind and solar power generation based on CEEMD-GA-BP neural network[J]. Power System and Clean Energy,2022,38(3):111−118.

    [15] 缪新颖,褚金奎,杜小文. LM-BP神经网络在大坝变形预测中的应用[J]. 计算机工程与应用,2011,47(1):220−222.

    MIAO Xinying,CHU Jinkui,DU Xiaowen. Application of LM-BP neural network in predicting dam deformation[J]. Computer Engineering and Applications,2011,47(1):220−222.

    [16] 王 月,江逸茗,兰巨龙. 基于改进三元组网络和K近邻算法的入侵检测[J]. 计算机应用,2021,41(7):1996−2002.

    WANG Yue,JIANG Yiming,LAN Julong. Intrusion detection based on improved triplet network and K-nearest neighbor algorithm[J]. Journal of Computer Applications,2021,41(7):1996−2002.

    [17] 朱墨然,王麒翔,张庆华. 多源数据驱动的防突预警指标自适应技术研究[J]. 煤炭科学技术,2022,50(8):75−81.

    ZHU Moran,WANG Qixiang,ZHANG Qinghua. Research on adaptive technology of outburst prevention early warning index driven by multi-source data[J]. Coal Science and Technology,2022,50(8):75−81.

    [18] 戴豪民,许爱强,孙伟超. 基于改进奇异谱分析的信号去噪方法[J]. 北京理工大学学报,2016,36(7):727−732,759.

    DAI Haomin,XU Aiqiang,SUN Weichao. Signal denoising method based on improvesingular spectrum analysis[J]. Transactions of Beijing Institute of Technology,2016,36(7):727−732,759.

    [19] 董维强,孟召平,沈 振,等. 基于循环神经网络的煤层气井产气量预测方法研究[J]. 煤炭科学技术,2021,49(9):176−183

    DONG Weiqiang,MENG Zhaoping,SHEN Zhen,et al. Research on coalbed methane well gas production forecast method based on cyclic neural network[J]. Coal Science and Technology,2021,49(9):176−183.

    [20] 邓立军,尚文天,刘 剑,等. 风门开闭对矿井风流影响规律模拟试验研究[J]. 安全与环境学报,2023,23(8):2759−2769.

    DENG Lijun,SHANG Wentian,LIU Jian,et al. Simulation experimental study on the effect of air door opening and closing on the wind flow law of mine[J]. Journal of Safety and Environment,2023,23(8):2759−2769.

    [21]

    SINGH A. Anomaly detection for temporal data using long short-term memory (LSTM)[D]. Sweden:KTH Royal Institute of Technology,2017.

  • 期刊类型引用(5)

    1. 丁艺鼎,范宏翔,徐力刚,蒋名亮,吕海深,朱永华,程俊翔. 可解释性长短期记忆模型用于预测湖泊总磷浓度变化. 湖泊科学. 2024(04): 1046-1060 . 百度学术
    2. 张若楠,徐平安,周小雨,赵琦琦. 基于堆叠式LSTM的采煤工作面瓦斯浓度预测方法. 陕西煤炭. 2024(09): 91-94 . 百度学术
    3. 柳璞,王晓霞. 融合风电动态特征与通道注意力的超短期风速混合预测. 电力科学与工程. 2024(08): 54-62 . 百度学术
    4. 陈炫中,王孝东,杨懿杰,吕玉琪,刘唱,杜青文,谢博. 矿井巷道风速智能感知技术研究进展. 矿产保护与利用. 2024(04): 124-134 . 百度学术
    5. 贾进章,尚文天,雷涛,李欣垚. 矿井智能通风发展趋势. 辽宁工程技术大学学报(自然科学版). 2024(05): 545-555 . 百度学术

    其他类型引用(2)

图(13)  /  表(3)
计量
  • 文章访问数:  103
  • HTML全文浏览量:  7
  • PDF下载量:  23
  • 被引次数: 7
出版历程
  • 收稿日期:  2023-04-02
  • 网络出版日期:  2024-03-17
  • 刊出日期:  2024-03-24

目录

/

返回文章
返回