Multi-scale pressure analysis and fluidization quality characterization of dry dense medium fluidized bed
-
摘要:
选煤是煤炭清洁加工利用的源头技术,干法选煤是干旱缺水地区与易泥化煤炭高效分选提质的重要途径。干法重介质流化床通过上升气流驱动加重质颗粒流化形成一定密度的气固流态化床层,实现对煤炭按密度分选,床层密度均匀稳定性即床层流化质量是决定分选精度的关键。受到气流、气泡、运动内构件、入料等多因素扰动,床层流化行为复杂多变,压力信号呈现出非均匀性、非线性、多尺度特征。基于干法重介质流化床压力信号的轴向差异传递与横向等效扩散特性,着重研究了床层轴向压差波动特征,提出流化质量定量表征方法。结果表明:基于时域分析可知,Geldart A类加重质颗粒床层总压降概率密度分布接近于正态分布;当床层散式膨胀时,由于颗粒间接触力的分布不均,概率密度呈现右偏且尖峰的偏离正态分布。通过频域分析发现,在床层膨胀区间的中末期,气泡主频主导了流化床的整个轴向区间;完全流化后的流化床,气泡主频仅控制着床层中部区域,床层浓度信号主频沿床层轴向分布变化明显。结合时域和频域信号分析结果,提出以轴向床层浓度主频为子区间波动标准差权重值的流化质量表征模型,可以综合评估干法重介质流化床的密度分布均匀性和稳定性,为干法重介质流化床分选密度稳态调控与精准分选提供有力支撑。
Abstract:Coal beneficiation is the source technology of clean processing and utilization of coal. Dry coal beneficiation is an important way for efficient separation and upgrading of easily sliming coal in arid area. Dry dense medium fluidized bed forms a certain density of gas-solid fluidized bed by updraft-driven heavy medium particles fluidization, thus achieving coal separation according to bed density. The uniformity and stability of bed density, namely the bed fluidization quality, is the key to determine the separation accuracy. Due to the disturbance of airflow, bubbles, moving internals, feeding and other factors, the fluidization behavior of the bed is complex and changeable, and the pressure signal shows non-uniformity, non-linearity and multi-scale characteristics. Based on the characteristics of axial differential transmission and lateral equivalent diffusion of pressure signal in dry dense medium fluidized bed, the fluctuation characteristics of axial differential pressure were studied emphatically, and a quantitative characterization method of fluidization quality was proposed. The results show that: Based on time domain analysis, the probability density distribution of total pressure drop in Geldart A type separation fluidized bed is close to normal distribution. When the bed is in the particulate expansion, due to the uneven distribution of contact force between particles, the probability density shows the right deviation and the peak, deviating from the normal distribution. Through frequency domain analysis, it is found that the dominant frequency of bubbles dominates the whole axial interval of fluidized bed at the later stage of bed expansion. After complete fluidization, the dominant frequency of bubbles only controls the central region of the bed. The dominant frequency of bed concentration signal changes obviously along the bed axial distribution. Combined with the results of time-domain and frequency-domain signal analysis, a fluidization quality characterization model was proposed, where the standard deviation of axial fluctuation is weighted and averaged, and the dominant frequency of sub-bed concentration is taken as the weight value. This model can comprehensively evaluate the uniformity and stability of density distribution of dry dense medium fluidized bed, and provide strong support for the steady-state control and accurate separation of dry dense medium fluidized bed.
-
0. 引 言
为了扎实推进智慧矿山的建设,提升企业整体的信息化、数字化水平,对井下监控系统与巡检机器人的检测及跟踪能力进行全面升级是十分必要的。国家煤矿安监局最新出台的《煤矿井下单班作业人数限员规定》将矿井按生产能力分为7档,对于各档次矿井下单班作业人数及采掘工作面作业人数做出限制。于是对井下人员进行实时跟踪及统计是避免发生安全事故的有效手段。但井下工作环境存在着光照不均,煤尘干扰严重等问题,导致工作人员无法长时间有效对监控视频进行多场景监控[1],且定点监控覆盖面有限。因此,使用巡检机器人取代工作人员进行实时监控对于减轻职工工作强度,降低岗位安全风险,实现企业减人增效和建设智慧矿山有着积极的作用[2]。
当今目标检测算法分为2大类:传统机器学习与深度神经网络。传统机器学习算法分为三部分:滑动窗口、特征提取、分类器[3]。此类算法针对性低、时间复杂度高、存在窗口冗余[4];并且手工设计的特征鲁棒性差、泛化能力弱[5],这导致传统机器学习算法逐渐被深度学习算法所取代[6]。李若熙等[7]通过YOLOv4[8]算法进行井下人员检测,在寻找目标中心点时引入聚类分析算法,提升了模型的特征提取能力。杨世超[9]通过Faster-RCNN[10]算法进行井下人员检测,将井下监控采集的图像输入到检测模型中提取特征,利用区域建议网络和感兴趣区域池化得到目标的特征图,最后通过全连接层得到目标的精确位置。董昕宇等[11]通过SSD[12]算法构建了一种井下人员检测模型,采用深度可分离卷积模块和倒置残差模块构建轻量化模型,提升了模型的检测速度。陈伟等[13]提出一种基于注意力机制的无监督矿井人员跟踪算法,结合相关滤波和孪生网络在跟踪任务的优势,构建轻量化目标跟踪模型。以上文献都是利用深度学习算法实现井下人员检测与跟踪,但是当出现目标遮挡时,检测效果均不佳;同时缺少对井下人员编码统计的能力;而且模型参数量较大,检测速率也有待提高[14]。
针对上述问题,基于YOLOv5s[15]和DeepSORT[16]模型进行改进,使用改进轻量化网络ShuffleNetV2[17]替代YOLOv5s主干网络CSP-Darknet53[18],使得模型在保持精度的同时降低了计算量。同时在改进ShuffleNetV2中添加Transformer[19]自注意力模块来强化模型深浅特征的全局提取能力。接着使用BiFPN[20]结构替换原Neck结构,使多尺度特征能够有效融合。最后使用更深层卷积强化DeepSORT的外观信息提取能力,有效的提取图像的全局特征和深层信息,减少了目标编码切换的次数。实验结果表明,改进后的模型有效解决了人员遮挡时检测效果不佳及编码频繁切换的问题。
1. YOLOv5s模型
YOLOv5是当前深度学习主流的One-Stage结构目标检测网络,共有4个版本:YOLOv5s、YOLOv5m、YOLOv5l、YOLOv5x。考虑到井下巡检机器人的轻量化设计,本文采用深度最小,特征图宽度最小的网络Yolov5s。其分为输入端Input、主干网络Backbone、颈部网络Neck、输出端Head四部分。输入端通过Mosaic数据增强、自适应锚框计算、自适应图片缩放,使得模型适用于各种尺寸大小图像的输入的同时丰富了数据集,提升了网络的泛化能力。主干网络包含:焦点层(Focus),Focus结构在之前的YOLO系列[21-23,8]中没有引入,它直接对输入的图像进行切片操作,使得图片下采样操作时,在不发生信息丢失的情况下,让特征提取更充分[24];跨阶段局部网络层(Cross Stage Partial Network,CSP) ,CSP[25]结构是为了解决推理过程中计算量过大的问题;空间金字塔池化(Spatial Pyramid Pooling,SPP),SPP[26]结构能将任意大小的特征图转换成固定大小的特征向量。Neck中采用的是FPN+PAN结构,负责对特征进行多尺度融合。Head输出端负责最终的预测输出,使用GIOU损失函数作为位置回归损失函数,交叉熵损失函数作为类别损失函数,其作用是在不同尺度的特征图上预测不同大小的目标。
2. 改进YOLOv5s井下人员检测算法
提出的井下人员检测框架如图1所示。首先将井下巡检机器人所采集的图像逐帧输入到改进YOLOv5s中进行训练,从而获取到网络的训练权重,最后利用测试集图像对本文改进的目标检测算法进行验证。
2.1 主干网络的替换
由于YOLOv5s具有较大的参数量,对于硬件成本要求较高,难以部署在小型的嵌入式设备或者移动端设备。因此使用轻量化网络ShuffleNetV2代替原主干网络CSP-Darknet53,通过深度可分离卷积来代替传统卷积减小参数量的同时高效利用了特征通道与网络容量,使得网络仍保持较高的精度[27]。表1展示了改进ShuffleNetV2结构,本文将原结构中最大池化卷积层采用深度可分离卷积进行替换,实现了通道和区域的分离,增强了网络的特征提取能力同时也降低了参数量;使用全局池化层替换原结构中的全连接层进行特征融合,保留了前面卷积层提取到的空间信息,提升了网络的泛化能力。
表 1 改进ShuffleNetV2结构Table 1. Improve the structural ShuffleNetV2层数 输出大小 核大小 步长 重复使用次数 通道数 Image 224×224 — — — 3 Conv1 112×112 3×3 2 1 24 DW conv 56×56 3×3 2 1 24 Stage2 28×28 — 2 1 116 Stage2 28×28 — 1 3 116 Stage3 14×14 — 2 1 232 Stage3 14×14 — 1 7 232 Stage4 7×7 — 2 1 464 Stage4 7×7 — 1 3 464 Conv5 7×7 1×1 1 1 1024 Global pooling 1×1 7×7 — — — 2.2 Transformer自注意力模块的融入
Transformer整个网络结构由自注意力模块和前馈神经网络组成。Transformer采用自注意力机制,将序列中的任意两个位置之间的距离缩小为一个定值,具有更好的并行性,符合现有的GPU框架[28]。本文在改进ShuffleNetV2中引入Transformer自注意力模块,与原始网络相比,添加Transformer模块可以提取到更加丰富的图像全局信息与潜在的特征信息,提升了模型的泛化能力。
本文融入的Transformer块结构图如图2所示,其主要由以下3部分构成。
高效自注意力层(Efficient Self-Attention)可以通过图像形状重塑,缩短远距离特征依赖间距,使网络更加全面地捕获图像特征信息[29]。自注意力公式如式(1)所示。
$$ {\rm{Attention}}({\boldsymbol{Q}},{\boldsymbol{K}},{\boldsymbol{V}}) = {\rm{soft}}\, \max \left(\frac{{Q{K^{\rm{T}}}}}{{\sqrt {{d_{\rm{k}}}} }}\right)V $$ (1) 式中,
$({W_{\rm{q}}},{W_{\rm{k}}},{W_{\rm{v}}})$ 为权重矩阵,负责将X映射为语义更深的特征向量Q,K,V,而${d_{\rm{k}}}$ 为特征向量长度。高效自注意力层通过位置编码来确定图像的上下文信息,输出图像的分辨率是固定的,当测试集图像与训练集图像的分辨率不同时,会采用插值处理来保证图像尺度一致,但是这样会影响模型的准确率[30]。针对此问题,本文在高效自注意力层后连接混合前馈网络(Mix Feedforward Network,Mix-FFN)来弥补插值处理对泄露位置信息的影响。混合前馈网络计算公式如式(2)、式(3)所示:
$$ {x_{{\rm{out1}}}} = {\rm{Conv}}(MLP({\rm{Norm}}({x_{{\rm{in}}}}))) $$ (2) $$ {x_{{\rm{out}}}} = {\rm{MLP}}({\rm{GELU}}({x_{{\rm{out1}}}})) + {x_{{\rm{in}}}} $$ (3) 式中,
${x_{{\rm{in}}}}$ 为上层输出;Norm为归一化处理;MLP为多层感知机;GELU代表激活函数。重叠块压缩层(Overlapping Block Compression,OBC)用于压缩图像尺寸和改变图像通道数,保留尺度稳定的特征,简化模型复杂度和降低冗余信息。
2.3 多尺度特征融合网络
原始YOLOv5s的Neck部分采用的是FPN+PAN结构,FPN是自顶向下,将高层的强语义特征向底层传递,增强了整个金字塔的语义信息,但是对定位信息没有传递。PAN就是在FPN的后面添加一个自底向上的路径,对FPN进行补充,将底层的强定位信息传递上去。但是该结构的融合方式是将所有的结构图转换为相同大小后进行级联,没有将不同尺度之间的特征充分利用,使得最终的目标检测精度未达到最优。因此,本文采用一种更为高效的BiFPN特征融合结构进行替代。其结构如图3所示,相较于原始特征融合结构,BiFPN能更有效的结合位于低层的定位信息与高层的语义信息,同时在通道叠加时将权重信息考虑进去,实现双向多尺度特征融合,通过不断调参确定不同分辨率的特征重要性,如式(4)所示。
$$ {\rm{Out}} = \sum\limits_{{i}} {\frac{{{\omega _{{i}}}}}{{\varepsilon + \displaystyle\sum\limits_{{j}} {{\omega _{{j}}}} }}} {\ln _{{\;i}}} $$ (4) 式中,i为第i个权重;j为权重总个数;ln为输入特征;Out为输出特征;
${\omega _{\rm{i}}}$ 为权重。将主干网络中Transformer模块提取出大小不同的特征图通过BiFPN进行融合,可以更加有效地融合全局深浅层的信息与关键的局部信息,将第一次下采样得到的特征图与后面的特征图进行跨层连接,使得定位信息能够获取充分,提升了模型小目标的检测性能;在特征融合时删除对模型贡献较低的节点,在同尺度特征节点间增加跳跃连接,减少了计算量;最终在提高模型精度及泛化能力的同时降低了漏检率且几乎不增加运行成本。
3. DeepSORT多目标跟踪算法及改进
使用本文提出的检测模型与改进DeepSORT跟踪算法搭配实现对井下人员的跟踪,首先将监测图像输入到改进Yolov5s目标检测网络,得到检测结果,然后通过改进DeepSORT算法逐帧对人员进行匹配,得到他们的轨迹信息,最后输出跟踪图像。
3.1 DeepSORT算法
DeepSORT是针对多目标的跟踪算法,其核心是利用卡尔曼滤波和匈牙利匹配算法,将跟踪结果和检测结果之间的IOU (Intersection over Union, 交并比)作为代价矩阵,实现对移动目标的跟踪。
为了跟踪检测模型找出的作业人员,DeepSORT使用8维变量x来描述作业人员的外观信息和在图像中的运动信息,如式(5)所示。
$$ x = (u,v,\gamma ,q,\dot u,\dot v,\dot \gamma ,\dot q) $$ (5) 式中:
$ (u,v) $ 为井下人员的中心坐标;$ \gamma $ 为人员检测框的宽高比;$ q $ 为人员检测框的高;$ (\dot u,\dot v,\dot \gamma ,\dot q) $ 为$ (u,v,\gamma ,q) $ 相应的速度信息。DeepSORT结合井下人员的运动信息与外观信息,使用匈牙利算法对预测框和跟踪框进行匹配,对于人员的运动信息,采用马氏距离描述卡尔曼滤波的预测结果和改进YOLOv5s检测结果之间的关联程度,如式(6)所示。
$$ {d^{(1)}}({{i}},{{j}}) = {({d_{{j}}} - {{\boldsymbol{y}}_{{i}}})^{\rm{T}}}{\boldsymbol{S}}_{{i}}^{ - 1}({d_{{j}}} - {{\boldsymbol{y}}_{{i}}}) $$ (6) 式中:
$ {d_{{j}}} $ 为第j个检测框;$ {{\boldsymbol{y}}_{{j}}} $ 为第i个检测框的状态向量;${{\boldsymbol{S}}_{{i}}}$ 为i条轨迹之间的标准差矩阵。当井下行人被障碍物长时间遮挡时,外观模型就会发挥作用,此时特征提取网络会对每个检测框计算出一个128维特征向量,限制条件为
$\left\| {{r_{{j}}}} \right\| = 1$ ,同时对检测到的每个人员构建一个确定轨迹的100帧外观特征向量。通过式(7)计算出这两者间的最小余弦距离。$$ {d^{(2)}} = ({{i}},{{j}}) = \min \left\{ {1 - {{\boldsymbol{r}}_{{j}}^{\rm{T}}}{\boldsymbol{r}}_{{k}}^{({{i}})}\left| {{\boldsymbol{r}}_{{k}}^{({{i}})} \in {R_{{k}}}} \right.} \right\} $$ (7) 式中:
${{\boldsymbol{r}}_{{j}}}$ 为检测框对应的特征向量;$ {{\boldsymbol{r}}_{{k}}} $ 为100帧已成功关联的特征向量。马氏距离在短时预测时提供可靠的目标位置信息,使用外观特征的最小余弦距离可使得遮挡目标重新出现后恢复目标 ID,为了使两种度量的优势互补,最终将两种距离进行线性加权作为最终度量,公式如式(8)所示。
$$ {c_{{{i}},{{j}}}} = \lambda {d^{(1)}}({{i}},{{j}}) + (1 - \lambda ){d^{(2)}}({{i}},{{j}}) $$ (8) 式中:
$ \lambda $ 为权重系数,若${c_{{{i}},{{j}}}}$ 落在指定阈值范围内,则认定实现正确关联。3.2 DeepSORT算法的改进
原始DeepSORT的外观特征提取采用一个小型的堆叠残差块完成,包含两个卷积层和六个残差网络。该模型在大规模路面行人检测数据集上训练后,可以取得很好的效果,但是井下环境光照不均匀,烟尘干扰严重,导致对井下人员跟踪的效果不理想,于是本文采用高效特征提取架构OSA(one shot aggregation)来替代原DeepSORT外观模型中的堆叠残差块以强化DeepSORT的外观特征提取能力,有效的提取图像中的全局特征和深层信息,达到减少人员编码切换次数的作用,OSA结构如图4所示。
在外观状态更新时,采用指数平均移动的方式替代特征集合对第t帧的第i个运动轨迹的外观状态进行更新。如式(9)所示。
$$ {{e}}_{{i}}^t = \alpha {{e}}_{{i}}^{t - 1} + (1 - \alpha )f_{\rm{i}}^t $$ (9) 式中:
$ f_{{i}}^t $ 为第t帧的第i个运动轨迹的外观嵌入;$ \alpha $ 为动量项。使用这种方式不仅减少了时间的消耗,同时提高了匹配的质量。4. 试验与分析
4.1 试验准备
本文采用Caltech行人数据集(Caltech Pedestrian Detection Benchmark)、INRIA行人数据集(INRIA Person Dataset)及自建井下人员检测及跟踪数据集对所提检测及跟踪算法井下进行验证。
1) Caltech行人数据集:此数据集为目前规模较大的行人数据集,使用车载摄像头录制不同天气状况下10 h街景, 拥有人员遮挡、目标尺度变化大、背景复杂等多种情形,标注超过25万帧,35万个矩形框,2300个行人。同时注明了不同矩形框之间的时间关系及人员遮挡情况。
2) INRIA行人数据集:此数据集为目前常见的静态人员检测数据集,数据集中人员身处不同光线条件及地点。训练集拥有正样本1000张,负样本1500张,包含3000个行人;测试集包含正样本350张,负样本500张,包含1200个行人,该数据集人员以站姿为主且高度均超100个像素,图片主要来源于谷歌,故清晰度较高。
3)自建井下人员检测及跟踪数据集:采集井下巡检机器人与监控视频拍摄的10万帧图像,筛选其中8000帧相似程度较低的图像构建数据集。首先使用ffmpeg工具将图像按帧切为图片,其中涵盖井下各种环境:光照不均2267张、煤尘严重1568张、目标遮挡3891张、其余环境1200张。其次采用Python编写的Labelimg对图片中人员进行标注,自动将人员位置及尺寸生成xml文件,最终转为适用于yolo系列的txt文件,包含每张图片中人员的中心位置(x, y)、高(h)、宽(w)三项信息。如图5所示,该数据集包含上万个人工标记的检测框。由于本文算法应用于井下人员的检测及追踪,故数据集中仅含“person”一个类。将图片数量按照7∶2∶1分为训练集、验证集和测试集。
试验使用平台参数如下:
配置 参数 操作系统 Windows 10 内存容量 32 GB GPU NVIDIA GeForce RTX 3070Ti CPU Intel 酷睿i7 12700H 模型框架 PyTorch1.7.1 编程语言 Python3.6 检测算法评价指标:使用模型参数量、检测时间、召回率
$ {M_{\rm{r}}} $ 、准确率$ {M_{\rm{p}}} $ 、漏检率$ {M_{\rm{m}}} $ ,误检率$ {M_{\rm{f}}} $ 及mAP@0.5作为检测算法的评价指标。$$ {M_{\rm{r}}} = \frac{{{T_{\rm{p}}}}}{{{T_{\rm{p}}} + {F_{\rm{N}}}}} $$ (10) $$ {M_{\rm{p}}} = \frac{{{T_{\rm{p}}}}}{{{T_{\rm{p}}} + {F_{\rm{p}}}}} $$ (11) $$ {M_{\rm{m}}} = \frac{{{F_{\rm{N}}}}}{{{F_{\rm{N}}} + {T_{\rm{p}}}}} $$ (12) $$ {M_{\rm{f}}} = \frac{{{F_{\rm{p}}}}}{{{F_{\rm{p}}} + {T_{\rm{N}}}}} $$ (13) $$ {\rm{mAP}} = \frac{{{T_{\rm{p}}} + {T_{\rm{n}}}}}{{{T_{\rm{p}}} + {T_{\rm{n}}} + {F_{\rm{p}}}}} $$ (14) 式中:
$ {T_{\rm{p}}} $ 为被正确检测出的井下人员;$ {F_{\rm{N}}} $ 为未被检测到的井下人员;$ {F_{\rm{P}}} $ 为被误检的井下人员;$ {T_{\rm{N}}} $ 为未被误检的井下人员;mAP为不同召回率上正确率的平均值。跟踪算法评价指标:
1)编码变换次数(ID switch, IDS),跟踪过程中人员编号变换及丢失的次数,数值越小说明跟踪效果越好。
2)多目标跟踪准确率(Multiple Object Tracking Accuracy),用于确定目标数及跟踪过程中误差累计情况,如式(15)所示。
$$ {{A}_{\rm{MOT}}}{\text{ = 1 }}- \frac{{\displaystyle\sum\limits_1^n t {{M_{\rm{m}}} + {M_{\rm{f}}} + {\rm{IDS}}} }}{{\displaystyle\sum\limits_1^n t {G{T_{{t}}}} }} $$ (15) 式中:
$ {M_{\rm{m}}} $ 为漏检率;$ {M_{\rm{f}}} $ 为误检率;${\rm{IDS}}$ 为编码转换次数;$ G{T_{\rm{t}}} $ 为目标数量;n为图片数量;t为第t张图片。3)多目标跟踪精度(Multiple Object Tracking Precision,PMOT),用于衡量目标位置的精确程度,如式(16)所示。
$$ P_{\rm{MOT}} = \frac{{\displaystyle\sum\limits_1^n {t,i} {{d_{{{t,i}}}}} }}{{\displaystyle\sum\limits_1^n t {{c_{{t}}}} }} $$ (16) 式中:
${d_{{{t,i}}}}$ 为目标i与标注框间的平均度量距离;$ {c_{{t}}} $ 为t帧匹配成功的数目。4)每秒检测帧数 (Frames Per Second, FPS)及模型参数量,体现模型运行的速率及成本。
4.2 目标检测试验结果与分析
将本文算法通过自建井下人员检测及跟踪数据集进行训练,输入图像大小为 608×608, 迭代次数为300,批次大小为 16,初始学习率设置为 0.01,后 150轮的训练学习率降为 0.001。动量设置为0.937,衰减系数为0.005。训练损失变化如图6所示。可以看出模型三类损失函数收敛较快且都收敛于较低值,表明改进算法具有良好的收敛能力与鲁棒性。
为了验证本文改进检测算法的有效性以及轻量化主干网络选择的合理性,将本文算法与YOLOv5s模型和YOLOv5s-ShuffleNetV2通过自建井下人员检测及跟踪数据集进行对比。
从图7中可以看出,原始YOLOv5s算法迭代到40次时,准确率上升到0.86左右,最终收敛在0.87左右;YOLOv5s-ShuffleNetV2在迭代到40次时,准确率上升到0.84左右,最终收敛在0.85左右;而本文所提算法在迭代40次时,准确率上升到0.91左右,最终收敛在0.92左右,较原始YOLOv5s模型提升了5.1%。
从图8中可以看出,原始YOLOv5s算法在迭代到40次时,mAP上升到0.85左右,最终收敛在0.86左右;YOLOv5s-ShuffleNetV2在迭代到40次时,mAP上升到0.85左右,最终收敛在0.85左右;而本文算法的迭代到40次时,mAP上升到0.89左右,mAP最终收敛在0.90左右,较原始YOLOv5s模型提升了5.2%。综上所述,本文选取的轻量化网络ShuffleNetV2可以使得检测模型保持一定精度的同时降低计算量;轻量化主干的改进、注意力机制的引入以及多尺度的融合对于目标检测性能有着明显的提升,因此,本文检测算法对于井下复杂环境中的人员检测具有良好的精度。
在YOLOv5s算法的基础上进行了改进轻量化主干网络的替换ShuffleNetv2、Transformer自注意力机制模块的融入、Neck部分进行BiFPN的替换。为了检验本文对检测阶段各改进点的有效性,以YOLOv5s模型为基准,使用消融实验在相同环境下进行进行验证,各模型参数设置保持一致,具体消融试验结果见表2。
表 2 消融试验结果Table 2. Ablation results模型 ShuffleNetv2 Transformer BiFPN 准确率 漏检率 召回率 误检率 时间/ms 参数量/MB 1 — — — 0.871 0.314 0.783 0.027 18.9 13.09 2 √ — — 0.859 0.322 0.794 0.030 12.4 3.45 3 √ √ — 0.883 0.235 0.831 0.021 13.3 4.17 4 √ — √ 0.877 0.249 0.831 0.019 13.7 4.34 5 √ √ √ 0.923 0.190 0.861 0.013 14.9 5.33 注:“√”表示对应部分已改进。 由表2可以看出,原始YOLOv5s的主干网络替换后,准确率下降了1.4%,速率提升了34%。在模型2中添加Transformer自注意力模块后,准确率提升了2.8%。在模型2中使用BiFPN替代原来的特征融合结构后,准确率提升了2.1%。在模型2中同时添加Transformer自注意力机制模块和BiFPN模块,准确率提升了7.4%,平均漏检率下降了40%,召回率提升了8.4%,平均误检率下降了51%。综上所述,单独添加Transformer自注意力模块和BiFPN模块,井下人员检测性能提升有限,而两种模块组合添加时,井下人员检测性能获得了很大的提升。相比于原始算法,准确率提升了5.2%;参数量下降了41%;检测速率提升了21%,达到0.0148 s/帧;为部署于巡检机器人奠定了基础。
为了验证文中检测算法具有良好的泛化能力,在2个公开行人数据集Caltech行人数据集、INRIA行人数据集上进行进一步验证,性能指标对比见表3。通过比较3个不同数据集中的性能指标,可以看出文中算法不仅适用于井下人员检测,在目标尺度变化大、背景复杂、光照剧烈等多数场景中人员检测效果也均优于原始YOLOv5s,因此,具有良好的泛化性与鲁棒性。
表 3 多数据集性能指标对比Table 3. Comparison of performance indicators of multiple data sets数据集 性能指标 YOLOv5s 本文算法 精确率 0.781 0.849 Caltech行人数据集 召回率 0.691 0.733 mAP 0.742 0.792 精确率 0.861 0.881 INRIA行人数据集 召回率 0.788 0.791 mAP 0.856 0.890 精确率 0.871 0.923 自建数据集 召回率 0.783 0.861 mAP 0.864 0.902 为了更加直观地体现文中检测算法的效果,选择Faster-RCNN、YOLOv3、YOLOv4、YOLOv5s 4种主流算法在自建数据集中选取光照不均、煤尘干扰、多目标移动、人员遮挡4种场景进行验证,检测结果如图9所示。
从第一组试验中,可以观察到光照不均严重,Faster-RCNN、YOLOv3、YOLOv4、YOLOv5s均出现误检的情况,而本文算法使用了BiFPN 结构使得多尺度特征能够有效融合,对于远处小目标检测能够起到了很好的识别作用。从第二组试验中,可以观察到粉尘干扰严重,除文中算法外,其余算法出现漏检、误检的情况,而文中算法由于融合了Transformer自注意力模块强化了模型深浅特征的全局提取能力,提升了目标在复杂环境中的对比度,有效抑制了粉尘的干扰。从第三、四组试验得出,本文算法对于井下环境中多目标移动对象及遮挡人员的检测也具有良好的效果。综上所述,文中检测算法在井下各种复杂环境中检测效果良好,与主流目标检测算法相比更适用于井下人员的检测。
4.3 井下人员跟踪结果与精度分析
为了验证文中算法在井下人员多目标跟踪方面的表现,本文通过自建井下人员检测及跟踪数据集上进行验证,以YOLOv5s-DeepSort为基准,使用原算法的参数设置,对检测与跟踪阶段进行消融试验来验证文中两阶段改进各自的有效性,结果见表4。
表 4 多目标跟踪结果对比Table 4. Comparison of multi-target tracking results算法 AMOT/% PMOT/% IDS FPS 参数量/MB YOLOv5s-DeepSORT 83.32 81.55 16 41 25.6 改YOLOv5s-DeepSORT 87.47 86.32 13 71 11.19 YOLOv5s-改DeepSORT 82.31 82.44 7 39 19.34 本文算法 89.17 87.91 4 67 5.91 由表4得出,文中目标检测阶段的改进在有效提升井下人员的检测精度的同时提升了检测速度,而跟踪阶段的改进有效减少了人员编号的转换,可以在出现人员遮挡的情况下有效提升检测的精度。文中检测及跟踪算法最终达到89.17%的精度;速率达到67帧;人员编码改变次数仅4次,目标编号改变次数降低了66.7%;参数量缩减到原始跟踪算法的23%。可以很好的满足井下人员实时检测及跟踪的需求。
为了更加直观展示文中跟踪算法的效果,文中选用戴德KJXX12C型防爆矿用巡检机器人进行验证,如图10a所示,该装置搭载本安型“双光谱”摄像仪,最小照度达彩色0.002 lux,高粉尘环境下,可通过红外摄像仪辅助采集井下图像。采集与控制系统采用STM32ZET6芯片,上位机检测及跟踪主控系统采用Windows版工控机。图像信息会通过千兆无线通讯传输在远端上位机,将环境运行代码安装于上位机。图像信息经过本文算法处理,结果将存储并实时显示于主控界面,如图10b所示,主控界面采用CS架构,由C#语言编写。监测人员通过主控界面实时及历史数据对工作面作业人数是否合格进行判断。
从图10c,图10d,图10e中可以观察到,在井下光照不足的环境中,井下2个作业人员相互遮挡并且持续行走一段距离后,巡检机器人能够进行稳定的检测跟踪并且其编号没有发生改变,实现有效计数,也能够证明我们改进的算法在复杂环境中出现井下人员遮挡时,也会在后续帧中匹配到被遮挡人员,对于遮挡情况具有良好的鲁棒性。
5. 结 论
1) 提出了一种改进YOLOv5s和DeepSORT的井下人员检测及跟踪算法。在YOLOv5s模型的基础上,使用轻量化网络ShuffleNetV2替换了原主干网络CSP-Darknet53,减少了模型的参数量。同时融入Transformer自注意力模块,可以提取到更多潜在的特征信息。使用多尺度特征融合网络BiFPN替换原Neck结构,能更好的融合全局深浅层信息与关键的局部信息。跟踪阶段使用更深层卷积强化了DeepSORT的外观信息提取能力。
2) 利用自建井下人员检测及跟踪数据集对本文算法进行验证。结果表明,本文井下人员检测算法的准确率达到了92%,检测速率达到0.0148 s/帧。多目标跟踪算法准确率提高到了89.17%,目标编号改变次数降低了66.7%,并且拥有良好的实时性。
3) 构建的改进YOLOv5s和DeepSORT的井下人员检测与跟踪算法能够实现在井下复杂环境中对人员的实时检测及跟踪,其参数量也缩减到原来的23%,不仅可以部署于煤矿监控系统,也可以部署在井下巡检机器人等小型嵌入式设备上,可以为井下人员的安全生产提供良好的保障。对于国家矿山安全监察局出台的《煤矿井下单班作业人数限员规定》早日实现智能化监测具有重要意义。
-
表 1 颗粒参数性质
Table 1 Parameter properties of particles
颗粒类型 平均粒径/
μm真密度/
(kg·m−3)堆密度/
(kg·m−3)最小流化速度/
(cm·s−1)Geldart A 83.20 4600 2540 0.83 表 2 不同流化流态下的理想特征频率
Table 2 Ideal characteristic frequency for different fluidization regimes
流化流态 单泡 多泡 爆发气泡 频率/Hz 0.64 3.18~6.37 1.11 表 3 不同静床高下的理论自然振荡频率
Table 3 Theoretical natural oscillation frequency of different static bed heights
静床高/cm 70 60 50 40 30 自然振荡频率/Hz 0.57 0.66 0.80 1.00 1.32 -
[1] 赵啦啦,江海深,赵跃民,等. 湿黏细粒煤干法筛分理论及交叉筛技术发展现状[J]. 煤炭科学技术,2022,50(10):251−258. ZHA0 Lala,JIANC Haishen,ZHA0 Yuemin,et al. Review of dry screening theory and cross screening technologyfor wet cohesive fine coal[J]. Coal Science and Technology,2022,50(10):251−258.
[2] 王国法,任世华,庞义辉,等. 煤炭工业“十三五”发展成效与“双碳”目标实施路径[J]. 煤炭科学技术,2021,49(9):1−8. doi: 10.13199/j.cnki.cst.2021.09.001 WANG Guofa,REN Shihua,PANG Yihui,et al. Development achievements of China's coal industry during the 13th Five-Year Plan period and implementation path of “dual carbon"[J]. Coal Science And Technology,2021,49(9):1−8. doi: 10.13199/j.cnki.cst.2021.09.001
[3] 赵跃民,张亚东,周恩会,等. 清洁高效干法选煤研究进展与展望[J]. 中国矿业大学学报,2022,51(3):607−616. ZHAO Yuemin,ZHANG Yadong,ZHOU Enhui,et al. Research progress and prospect of clean and efficient dry coal separation[J]. Journal of China University of Mining & Technology,2022,51(3):607−616.
[4] 周晨阳,贾 颖,赵跃民,等. 介尺度视角下干法重介流态化分选过程强化[J]. 化工学报,2022,73(6):2452−2467. ZHOU Chenyang,JIA Ying,ZHAO Yuemin,et al. Intensification of dry dense medium fluidization separation process from a mesoscale perspective[J]. CIESC Journal,2022,73(6):2452−2467.
[5] DAI W,ZHANG L,FU J,et al. Dual-rate adaptive optimal tracking control for dense medium separation process using neural networks[J]. IEEE Transactions on Neural Networks and Learning Systems,2020,32(9):4202−4216.
[6] ZHOU C,LIU X,ZHAO Y,et al. Recent progress and potential challenges in coal upgrading via gravity dry separation technologies[J]. Fuel,2021,305:121430. doi: 10.1016/j.fuel.2021.121430
[7] BI H T. A critical review of the complex pressure fluctuation phenomenon in gas–solids fluidized beds[J]. Chemical Engineering Science,2007,62(13):3473−3493. doi: 10.1016/j.ces.2006.12.092
[8] XIANG J,LI Q,WANG A,et al. Mathematical analysis of characteristic pressure fluctuations in a bubbling fluidized bed[J]. Powder Technology,2018,333:167−179. doi: 10.1016/j.powtec.2018.04.030
[9] VAN OMMEN J R,SASIC S,VAN DER SCHAAF J,et al. Time-series analysis of pressure fluctuations in gas–solid fluidized beds–A review[J]. International Journal of Multiphase Flow,2011,37(5):403−428. doi: 10.1016/j.ijmultiphaseflow.2010.12.007
[10] ZHAO Y,LI G,LUO Z,et al. Industrial application of a modularized dry-coal-beneficiation technique based on a novel air dense medium fluidized bed[J]. International Journal of Coal Preparation and Utilization,2017,37(1):44−57. doi: 10.1080/19392699.2015.1125344
[11] 盛 成. 浓相气固分选流态化非稳定性研究 [D]. 徐州: 中国矿业大学, 2018. SHENG Cheng. Instability analysis of dense gas solid separation fluidization [D]. Xuzhou: China University of Mining and Technology, 2018.
[12] LUO Z,ZHAO Y,LV B,et al. Dry coal beneficiation technique in the gas–solid fluidized bed: a review[J]. International Journal of Coal Preparation and Utilization,2022,42(4):986−1014. doi: 10.1080/19392699.2019.1678469
[13] 张 勇. 气固分选流化床中多组分颗粒分层与混合的数值模拟研究 [D]. 徐州: 中国矿业大学, 2019. ZHANG Yong. Numerical study of the segregation and mixing of polydisperse particles in gas-solid separating fluidized beds [D]. Xuzhou: China University of Mining and Technology, 2019.
[14] XIANG J,LI Q,TAN Z,et al. Characterization of the flow in a gas-solid bubbling fluidized bed by pressure fluctuation[J]. Chemical Engineering Science,2017,174:93−103. doi: 10.1016/j.ces.2017.09.001
[15] 向 杰. 气固流化床的压力和空隙率波动信号分析 [D]. 北京: 清华大学, 2018. XIANG Jie. Analysis of pressure and voidage fluctuations in gas-solid fluidized beds [D]. Beijing: Tsinghua University, 2018.
[16] GHEORGHIU S,VAN OMMEN J,COPPENS M-O. Power-law distribution of pressure fluctuations in multiphase flow[J]. Physical Review E,2003,67(4):041305. doi: 10.1103/PhysRevE.67.041305
[17] VALVERDE J,QUINTANILLA M,CASTELLANOS A,et al. Experimental study on the dynamics of gas-fluidized beds[J]. Physical Review E,2003,67(1):016303. doi: 10.1103/PhysRevE.67.016303
[18] WANG J,VAN DER HOEF M A,KUIPERS J. CFD study of the minimum bubbling velocity of Geldart A particles in gas-fluidized beds[J]. Chemical Engineering Science,2010,65(12):3772−3785. doi: 10.1016/j.ces.2010.03.023
[19] TSINONTIDES S,JACKSON R. The mechanics of gas fluidized beds with an interval of stable fluidization[J]. Journal of Fluid Mechanics,1993,255:237−274. doi: 10.1017/S0022112093002472
[20] SUNDARESAN S. Instabilities in fluidized beds[J]. Annual review of fluid mechanics,2003,35(1):63−88. doi: 10.1146/annurev.fluid.35.101101.161151
[21] LOEZOS P N,COSTAMAGNA P,SUNDARESAN S. The role of contact stresses and wall friction on fluidization[J]. Chemical Engineering Science,2002,57(24):5123−5141. doi: 10.1016/S0009-2509(02)00421-9
[22] DING Z,TIWARI S S,TYAGI M,et al. Computational fluid dynamic simulations of regular bubble patterns in pulsed fluidized beds using a two‐fluid model[J]. The Canadian Journal of Chemical Engineering,2022,100(2):405−422. doi: 10.1002/cjce.24082
[23] KAGE H,IWASAKI N,YAMAGUCHI H,et al. Frequency analysis of pressure fluctuation in fluidized bed plenum[J]. Journal of Chemical Engineering of Japan,1991,24(1):76−81. doi: 10.1252/jcej.24.76
[24] JOHNSSON F,ZIJERVELD R,SCHOUTEN J V,et al. Characterization of fluidization regimes by time-series analysis of pressure fluctuations[J]. International journal of multiphase flow,2000,26(4):663−715. doi: 10.1016/S0301-9322(99)00028-2
[25] VERLOOP J,HEERTJES P. Periodic pressure fluctuations in fluidized beds[J]. Chemical Engineering Science,1974,29(4):1035−1042. doi: 10.1016/0009-2509(74)80096-5
[26] ROY R,DAVIDSON J,TUPONOGOV V. The velocity of sound in fluidised beds[J]. Chemical Engineering Science,1990,45(11):3233−3245. doi: 10.1016/0009-2509(90)80216-2
[27] AGHBASHLO M, SOTUDEH-GHAREBAGH R, ZARGHAMI R, et al. Measurement techniques to monitor and control fluidization quality in fluidized bed dryers: A review[J]. Drying Technology, 2014, 32(9): 1005-1051.
-
期刊类型引用(15)
1. 毛清华,苏毅楠,贺高峰,翟姣,王荣泉,尚新芒. 基于改进YOLOv8模型的井下人员入侵带式输送机危险区域智能识别. 工矿自动化. 2025(01): 11-20+103 . 百度学术
2. 李小军,赵明炀,李淼. 基于深度学习的钻孔冲煤量智能识别方法. 煤田地质与勘探. 2025(01): 257-270 . 百度学术
3. 路洋,董立红,叶鸥. 基于自适应链接优化的井下行人抗遮挡跟踪方法研究. 工矿自动化. 2025(02): 65-75+137 . 百度学术
4. 柳小波,范立鹏,秦丽杰,王连成,张兴帆. 机器视觉技术在矿山行业的应用现状与展望. 有色金属(矿山部分). 2025(02): 1-15 . 百度学术
5. 唐俊飞,邢海龙,李溯,张涛涛,刘恒,姚诗雨. 结合改进CNN与自注意力机制的煤矿轮式机器人目标检测技术. 煤矿安全. 2025(03): 224-232 . 百度学术
6. 张宇豪,肖新宇,朱梓润,訾梦超,廖金湘. 一种基于DeepSORT的逆透视车流量检测方法. 轻工科技. 2024(01): 98-100 . 百度学术
7. 王洪磊,郭鑫,张亦凡,张俊升. 煤质煤量全面在线检测技术发展现状及应用进展. 煤炭科学技术. 2024(02): 219-237 . 本站查看
8. 邵小强,李鑫,杨永德,原泽文,杨涛. 基于改进YOLOv7的矿井人员检测算法. 电子科技大学学报. 2024(03): 414-423 . 百度学术
9. 王茂森,鲍久圣,章全利,杨阳,袁晓明,阴妍,张可琨,葛世荣. 煤矿井下单轨吊无人驾驶目标识别算法与轨道接缝检测方法. 煤炭学报. 2024(S1): 457-471 . 百度学术
10. 狄靖尧,杨超宇. 基于改进Transformer的井下人员检测算法. 科学技术与工程. 2024(26): 11188-11194 . 百度学术
11. 解北京,李恒,董航,栾铮,张奔,李晓旭. 基于多尺度特征融合井下猴车载人状态的智能识别算法与应用. 煤炭科学技术. 2024(12): 272-286 . 本站查看
12. 孙林,陈圣,姚旭龙,张艳博,陶志刚,梁鹏. 煤矿井下残缺信息的多目标检测方法研究. 煤炭科学技术. 2024(S2): 211-220 . 本站查看
13. 范伟强,王雪瑾,张颖慧,李晓宇. 改进YOLOv7和DeepSORT的井下人员检测与跟踪算法. 煤炭科学技术. 2024(S2): 343-355 . 本站查看
14. 程德强,寇旗旗,江鹤,徐飞翔,宋天舒,王晓艺,钱建生. 全矿井智能视频分析关键技术综述. 工矿自动化. 2023(11): 1-21 . 百度学术
15. 郝明月,闵冰冰,张新建,赵作鹏,吴晨,王欣. 基于改进YOLOv5s的矿工排队检测方法. 工矿自动化. 2023(11): 160-166 . 百度学术
其他类型引用(7)