煤矿机电与智能化
煤炭是我国的主体能源,煤矿安全高效开采是经济发展与社会稳定的重要保障。由于井下环境多变,空间相对狭小,所以煤矿安全事故时有发生,极易造成人员的伤亡和财产的巨大损失,保护井下人员生命安全是重中之重,对井下情况的掌握成为煤炭安全开采的首要保证。优秀的人员管理系统能够掌握井下各个方位的情况,可为有效率的抢险救灾提供重要信息。
煤矿井下是一个特殊的场所,与地面相比井下工人的着装更加统一,井下照度低、粉尘大、电磁干扰等因素使井下图像质量差,这也大幅增加了视频监控对井下人员的识别难度,监控人员无法直接从视觉对视频中的人员进行辨认。除此之外煤矿井下空间存在着较为恶劣的环境,大量的粉尘和烟雾对视频监控造成极大的影响,进行处理的视频信号在采集时存在着大量的光照不均以及噪声等干扰,所以复杂的井下环境对视频监控和分析影响不可避免。
目前常用的视频监控中人员识别的方法是基于虹膜的,刘岗[1]提出在井下考勤中,通过利用人体固有的生理特征作为分辨的唯一属性,降低了识别误差。但是井下环境复杂,虹膜识别所十分依赖的光学环境达不到要求,井下的低光照对识别结果造成很大的影响,并且所需要的20~40 cm的测量距离难以保证,这会使得人员识别造成较大的误差。
另一类人员识别的方法是基于图像识别领域的,杨米娜[2]提出通过视频监控计算机将采集的视频中人员面部的照片或步态动作进行提取,并与在数据库中所存储的面部照片或步态数据进行比对从而达到分辨的目的。然而在井下实践中,其算法都有一定的局限性使其在井下应用十分困难:步态识别算法由于发展并不完善,导致其对人员步态轮廓的提取精度不高,并且步态识别需要提取一部分时间内视频中人员的步态,增加了井下系统存储压力。面部识别中的传统LBP算法尽管自身对光照有较强的鲁棒性,但它易受噪声的影响,当图像中存在大量噪声时图像的纹理特征结构会出现较大的误差。除此之外作为局部二值模式,传统LBP算子只考虑到微观的特征,缺乏对图像整体的把握,这都对最终的识别造成了较大的影响。
针对目前人员识别技术现状,笔者提出了基于多尺度统一化LBP算子的井下人员人脸识别算法。为了减少井下噪声对井下监控中图像提取效果的影响,提出在预处理时采用直方图均衡化,增强井下人员面部图像的对比度。对于预处理后的图像,利用LBP算子在纹理特征提取时对光照较强的鲁棒性,基于传统LBP算法将LBP算子统一化,满足井下监控对实时性的要求。在此基础上笔者进一步引入多尺度的概念,将统一化LBP算子形成MB-LBP算子,从而克服传统LBP算子易受噪声影响的特点,进一步提升抗噪性,削弱局部噪声的影响。最后结合图像分区,将处理的对象由一块大区域转化为几块不同的小区域,增强算法对图像整体的把握,克服传统LBP算子的微观局限性,克服了井下由于局部光照不足对整体识别精度的影响。通过图像分区化,MB-LBP算子特征提取形成了分区MB-LBP复合特征向量,在分类识别中笔者利用卡方检验将视频监控中获得的井下人员面部图像复合特征向量与数据库中的复合特征向量相比较,达到对目标人员的识别。
对人脸图像进行直方图均衡化处理,可使原本比较少像素的灰度分配到其他的灰度中,处理后灰度范围变大,对比度变大,能有效提高图像细节。由于井下环境复杂且恶劣,光照条件不良,通过摄像头直接采集到的图像由于缺乏亮度导致图像对比度较差,影响之后图像识别算法的特征提取。因此笔者提出在预处理中使用直方图均衡化,通过这种方法处理后的图像对比度明显提高,便于之后的特征提取。
直方图均衡化的基本思想是把原始灰度直方图中某个比较集中的灰度区间进行展宽,并对数量较少的灰度区间进行压缩,重新分配像素灰度值,使一定范围内的像素数量大致相同,达到均衡化的效果[3]。
一个灰度级在范围(0,L-1)的图像,设其灰度直方图为函数p(rk)。
p(rk)=nk/n
式中:n为图像的像素总数;nk为图像中第k个灰度级的像素总数;rk为第k个灰度级,k=0~(L-1)。
定义一个新的变换函数为
s=T(r)=pr(w)dw
其中,r为灰度,ps(s)为均匀概率函数,原图像中不均匀的灰度级也变得均匀。通过灰度变换,直方图均衡化使得图像不同灰度级的像素数量更加趋近,从而提升了图像对比度,增强了细节,效果如图1所示。
图1 直方图均衡化前后图像对比
Fig.1 Image comparison before and after histogram equalization
统一化LBP算子是传统LBP算子的改进形式,它在保留了传统LBP算子的纹理描述优点之外提高了计算的效率。井下管理系统中对人员的监控要保证实时性,因此在对人员识别中要尽量克服延时造成的影响,因此减少算法中繁琐的数据、提高效率是关键。统一化LBP算子使图像的特征向量维数大幅降低,而且由于统一模式占总模式中的绝大多数,这样可以在不损失太多信息的情况下,节约内存空间,提高运算速度。
LBP最早是作为一种有效的纹理描述算子提出的,由于其对图形局部纹理特征的卓越描绘能力而获得了十分广泛的应用。LBP的基本思想是对图像的像素和它局部周围像素进行对比后的结果进行求和,对于图像中的每一个像素点,以该点的灰度作为阈值,对其周围3×3的8邻域进行二值化,按照一定的顺序组成一个8位二进制数,以此二进制数的值作为该点的响应[4-6]。
一个LBP操作可以更加精确地定义为
式中:(xc,yc)为中心像素;ic为像素亮度;in为相邻像素的亮度;p为一个符号函数。
为了更广泛地应用LBP算子,圆形的邻域被用来替代传统的8邻域,结合双线性插值运算可以获得任意半径和任意数目的邻域像素点。双线性插值的过程如图2所示,I为像素点,位于图像中第i行和第j列的中心点和8个邻域点用大点标出。分别计算出2个十叉点1和2的水平插值V1、V2,V1根据与之处于同一行的I(i-2,j-2)以及I(i-2,j-1)的线性插值得到[7-9]:
[I(i-2,j-1)-I(i-2,j-2)]
同理可计算出点2的值:
[I(i-1,j-1)-I(i-1,j-2)]
计算出点1和点2竖直线性插值:
图2 双线性插值确定不在像素中心位置的邻域点
Fig.2 Bilinear interpolation determines neighborhood points that are not at the center of pixel
尽管基本LBP算子有着卓越的纹理描绘能力,但在实际应用中由于其众多的二进制模式使得得到的直方图过于稀疏。因此统一化LBP算子被用来减少一些冗余的LBP模式,同时又保留足够的具有重要描绘能力的模式。
对于一个标准局部二进制模式,在将其二进制位串视为循环的情况下,如果其中包含的从0到1或者从1到0转变不多于2个,则将这个局部二进制模式称为统一化模式[10-12]。
统一化LBP算子可以在几乎不损失图像信息的条件下精细地描述图像局部的纹理信息,这些信息可以用来作为井下人员面部识别的特征,并且通过统一化的降维,人员识别的实时性得以保证。尽管通过直方图均衡化的预处理在一定程度上降低了噪声的影响,但是井下的高粉尘等噪声使得统一化LBP算子对井下噪声的鲁棒性依旧不够,这也很大程度上影响了最终的识别。为了进一步提升统一化LBP算子的抗噪性,笔者引入了多尺度分块使其增强对图像整体的把握。在多尺度分块的基础上,引入图像分区进一步减少局部噪声对整体纹理特征的影响,利用分区复合特征向量进行目标识别。通过如上分析,多尺度分区统一化LBP算子在对井下人员面部识别的整体算法流程如图3所示。
图3 多尺度分区统一化LBP算子整体算法流程
Fig.3 Overall algorithm flow of multi-scale partitioning unified LBP operator
统一化LBP算子具有良好的旋转不变性和灰度不变特性,能够有效地提取图像特征。然而直接在原始图像上运用LBP算子存在以下问题:特定尺寸的统一化LBP算子对于其所能提取的部分有着局限性,特征提取能力有限。因此多尺度局部二值模式(MB-LBP)被提出以弥补传统LBP的不足[13-15]。
在MB-LBP的计算中,传统LBP算子像素值之间的比较被像素块之间的平均灰度的比较所代替,通常以符号MBD-LBPu2P,R表示块大小为D×D的LBPu2P,R算子。当像素块大小D为1时与基本LBP算子相同,一个MB-LBP算子的例子如图4所示[16-18]。
图4 一种MB-LBP算子
Fig.4 One kind of MB-LBP operator
在使用MB-LBP算子提取图像纹理时,可以通过改变像素块的大小得到图像不同尺度的特征[19-20],原图像以及D分别为1、2、3时MB-LBP提取的纹理特征如图5所示。
图5 MB-LBP提取的纹理特征
Fig.5 Texture feature map extracted by MB-LBP
通过图5不难看出,随着像素块大小D的增加,响应图像中纹理增粗并且趋于稳定,说明对相对较大D的MB-LBP直方图的分析有助于把握图像中的粗粒度信息。
通过多尺度分块,MB-LBP算子增强了对噪声的健壮性,提升了传统LBP算子对整体信息的粗粒度把握,但作为图像的一阶统计特征,直方图无法描述图像的结构信息。而图像各个区域的局部特征通常差异较大,如果仅对整个图像生成一个LBP直方图,这些局部的差异信息就会丢失。为了弥补这一缺陷,笔者提出采用分区MB-LBP特征。
分区MB-LBP首先将整个图像分为P×Q个分区,在每个图像分区中提取其纹理特征,最终将所有分区的直方图纹理特征组合成一个复合的特征向量来代表整个图像的LBP直方图特征。
理论上,越小越精细的分区可以带来更好的局部描述能力,但也会产生更高维数的复合特征,过小的分区将失去统计意义,3种不同分区14×13、7×6、5×4像素块大小所形成的复合LBP直方图如图6所示。
图6 3种不同分区复合LBP直方图
Fig.6 Three different partitioned composite LBP histograms
为保证每个分区中的像素块个数基本相同,对于像素块大小为1的MB-LBP笔者选择了较大的14×13的分区,相反地对于像素块大小为3的MB-LBP选择了较小的5×4的分区,通过图6可以看出越小越精细的分区提供了更好的局部描述能力的同时,产生了更高维数的复合特征,最终得到的复合LBP直方图可以直接作为图像的特征向量来使用。
本文涉及的方法均在MATLAB平台上进行试验验证,并在配置为Intel Core i7-6500U 2.50 GHz. CPU的PC机下运行。
试验样本选择不同时刻井下采集到的人脸面部图像,其中人脸面部图像来自神华神东煤炭集团智能视频监控平台终端对综采工作面的视频监控。试验样本集图像共40幅,图像格式为.jpg。随机从样本集的40幅井下人员面部图像中选取10幅图像作为训练集。
利用视频监控平台采集到的40幅人脸面部图像构建的样本集进行试验,对井下人员人脸面部图像进行直方图均衡化,得到经过处理后的对比度增强的待识别图像。将待识别图像进行分区处理,利用多尺度MB-LBP算子对待识别图像中每个小分区进行纹理特征提取,得到每个分区的特征向量。将每个分区的MB-LBP特征直方图进行级联,形成整个图像特征直方图。利用卡方检验,将待识别的图像的整体特征直方图与数据库中储存的所有井下人员面部特征直方图进行对比达到分类识别。
卡方检验的原理如下[21-22]:卡方检验作为假设检验的一种,是以卡方分布为基础的一种非参数检验方法。卡方检验常用于检验一定显著性水平上2个或2个以上样本之间的差异度,当样本之间的差别较大,它们之间的卡方值χ2就越大[23]。卡方检验的计算式为
式中:Ai为i水平的观察频数;Ei为i水平的期望频数;n为总频数;pi为i水平的期望频率。
在人脸特征匹配时,可以将已有图像的每个特征作为均值,而待匹配图像特征作为变量xi,如果检验结果小于阈值,则可认为待匹配图像和原图像相同。将卡方检验计算公式应用在多尺度统一化LBP算子进行人脸识别可以改进如下:
式中:wi,j为每块小区域的权重;Mi,j为已知图像的直方图数据;Si,j为待匹配图像的直方图数据。
在图像分区时,越小越精细的分区可以更好地对局部细节进行描述从而提升识别精度,但与此同时图像整体的复合特征向量也将变得更为复杂,更高维的复合向量在进行卡方检验时识别精度也将下降。为了寻找到最恰当的图像分区大小以获得最高的井下人员面部识别精度,设图像分区大小为i×j,分别取2×1、3×2、4×3、…、20×21,其中j=i-1,探究井下人员人脸面部识别率与图像分区大小的关系,试验结果如图7所示。
图7 图像分区i值对识别率的影响
Fig.7 Effect of image partition i on the recognition rate
由图7可知,刚开始,井下人员人脸正确识别率随图像分区值i的增大而有所提高,在i=7时,井下人员人脸正确识别率最高,当i>7时,井下人员人脸正确识别率有比较明显的下降,但随着i值的逐渐增大正确识别率逐渐趋于平稳。试验中选取i=7,此时井下人员人脸正确识别率最高。
利用卡方检验对试验中选取的i=7时所提取的井下人员面部多尺度统一化LBP特征向量进行识别判断,其中自由度n=i×j=42,显著性水平阈值α取0.05。
对试验样本中的井下人员面部图像随机抽取10幅,经过直方图均衡化后分区,采用多尺度统一化LBP算子对面部特征进行提取,形成复合特征向量,分类中采用自由度为42,显著性水平阈值为0.05的卡方检验进行识别,为排除偶然性误差,每幅图像进行40次分类,分类结果见表1。
表1 井下人员面部识别分类结果
Table 1 Classification results of personnel facial recognition in underground mine
样本分类结果样本1样本2样本3样本4样本5样本6样本7样本8样本9样本10总计正确37373837383938373937377错误332321231323
由表1可知,井下人员面部图像总体分类识别率为94.25%,其中分类识别率最高为97.5%,分类识别率最低为92.5%,达到了较好的分类识别效果。
为了进一步证明笔者所提出的方法对光照和噪声鲁棒性的提高,笔者采用2种井下人脸识别算法,即统一化LBP算法和基于LDA的Fisherface算法进行对比试验,试验具体流程如下:其中,基于LDA的Fisherface算法规定出一系列互不正交的特征向量,从图像的整体入手,将目标图像表示为不同特征向量的组合,在分类时通过比较待匹配图像的特征向量矢量系数与原图像矢量系数矢量差进行判断。为保证对比试验在分类识别中的一致性,其在分类中也采用卡方检验,显著性水平阈值同样取0.05,为排除偶然性误差,每幅图像进行40次分类,分类结果见表2。
表2 Fisherface算法对比试验中的试验结果
Table 2 Experimental results in the comparison test of Fisherface algorithm
样本分类结果样本1样本2样本3样本4样本5样本6样本7样本8样本9样本10总计正确34363436363533353433346错误646445756754
由表2可知,采用Fisherface算法井下人员面部图像总体分类识别率为86.50%。统一化LBP算法与笔者提出的算法相比保留了LBP算法对光照鲁棒的特性,但其只考虑了纹理特征的变化而缺乏对图像整体特征的把握。待检测图像不进行分区处理,通过单一的尺度算子直接对图像的纹理特征提取,此方法其他识别步骤同本文方法。为保证对比试验在分类识别中的一致性,其在分类中也采用卡方检验,显著性水平阈值同样取0.05,为排除偶然性误差,每幅图像进行40次分类,分类结果见表3。
表3 统一化LBP算法对比试验中的试验结果
Table 3 Experimental results in comparison experiments with unified LBP algorithms
样本分类结果样本1样本2样本3样本4样本5样本6样本7样本8样本9样本10总计正确35363535363635353637356错误545544554344
由表3可知,采用传统LBP算法井下人员面部图像总体分类识别率为89.00%,将3种识别方法加以总结,Fisherface、统一化LBP、多尺度分区统一化LBP三种井下人脸识别算法平均识别率分别为86.50%、89.00%、94.25%。由此可知,笔者所提出的方法平均识别率达到94.25%,与传统的LBP算法相比,笔者所提出的算法平均识别率提高了5%,这表明图像分区以及多尺度统一化的改进对LBP算子在光照和噪声的鲁棒性明显增强,并且对图像局部的细节描述更加全面,也表明笔者所提出的方法在对井下人员面部识别的有效性。
1)通过多尺度统一化LBP算子处理,经过直方图均衡化后的井下人员面部图像纹理特征信息得到充分且有效的提取,可以全面地反映井下人员的面部特征。
2)卡方检验在对提取的符合特征向量分类识别中取得了较好的效果,结合分区加权可以更灵活地对要识别的面部图像有目的地分类。
3)与传统的井下人员面部识别算法相比,多尺度统一化LBP算子对噪声和光照的鲁棒性有了明显提高。结合图像分区,多尺度统一化LBP算子对图像局部和整体的把握能力取得了较好的效果。在对井下人员面部进行识别时,多尺度统一化LBP算子比传统的算法在识别正确率上有较高提升,表明了该方法对于井下人员面部识别的可行性和有效性。
4)与传统算法相比,笔者提出的算法在井下人员识别中取得了进步,但在实践中其自身也有着一定的局限性,需要在之后进一步完善:①尽管通过多尺度分区处理增加了对井下人员面部的识别准确率,但本算法在实践中还无法达到人员识别的实时性,这也造成了监控中识别的时延。②通过多次对井下摄像采集到的图像的分析,笔者发现在某些特定环境下,例如一些较为窄小的操作面摄像头很难采集到井下人员面部的图像,取而代之的只是一段时间中的背影。为解决这个问题,笔者设想在之后算法的完善过程中是否可以将特征向量由面部特征变为井下人员的步态,进一步提升识别准确率。
[1] 刘 岗.井下虹膜考勤系统的探索与实践[J].科学技术创新,2018(15):66-67.
LIU Gang.Exploration and practice of underground iris attendance system [J].Scientific and Technological Innovation, 2018 (15): 66-67.
[2] 杨米娜.基于图像处理的井下人员身份识别[J].煤炭技术,2018,37(9):339-342.
YANG Mina.Underground personnel identification based on image processing [J].Coal Technology, 2018, 37 (9): 339-342.
[3] 吴成茂.直方图均衡化的数学模型研究[J].电子学报,2013,41(3):598-602.
WU Chengmao.Studies on mathematical model of histogram equalization[J].Acta Electronica Sinica,2013,41(3):598-602.
[4] 黄金钰,张会林,闫日亮.LBP直方图与PCA的欧式距离的人脸识别[J].计算机系统应用,2012,21(6):202-204,198.
HUANG Jinyu,ZHANG Huilin,YAN Riliang.Face recognition of LBP histogram PCA and euclidean distance[J].Computer Systems & Applications,2012,21(6):202-204,198.
[5] 王 宪,张 彦,慕 鑫,等.基于改进的LBP人脸识别算法[J].光电工程,2012,39(7):109-114.
WANG Xian,ZHANG Yan,MU Xin,et al.Face recognition algorithm based on improved LBP [J].Photoelectric Engineering,2012,39 (7): 109-114.
[6] 黄非非.基于LBP的人脸识别研究[D].重庆:重庆大学,2009.
[7] 翁宁龙,刘 冉,吴子章.一种改进的LBP特征的人脸识别方法[J].信息通信,2011(3):3-4.
WENG Ninglong,LIU Ran,WU Zizhang.An improved face recognition method based on LBP feature [J].Information Communication,2011 (3): 3-4.
[8] 刘伟锋,李树娟,王延江.人脸表情的LBP特征分析[J].计算机工程与应用,2011,47(2):149-152.
LIU Weifeng,LI Shujuan,WANG Yanjiang .Facial expression analysis using LBP features[J].Computer Engineering and Applications,2011,47(2):149-152.
[9] 熊承义,李丹婷,笪邦友.基于LBP和PCA特征提取的人脸识别[J].中南民族大学学报:自然科学版,2011,30(2):75-79.
XIONG Chengyi,LI Danting,DA Bangyou.Feature extraction using LBP and PCA for face recognition[J].Journal of South-Central University for Nationalities:Natural Science Edition,2011,30(2):75-79.
[10] JIANG Guoxing,CHENG Yanfang.An LBP-based multi-scale illumination preprocessing method for face recognition[J].Journal of Electronics(China),2009,26(4):201-207.
[11] 赵 强,崔 畅.基于多尺度LBP和SVM的掌纹识别算法研究[J].激光杂志,2015,36(1):27-30.
ZHAO Qiang,CUI Chang.Research of palmprint identification algorithm based on multiscale LBP and SVM[J].Laser Journal,2015,36(1):27-30.
[12] JIA Xiaofei,YANG Xin,CAO Kai,et al.Multi-scale local binary pattern with filters for spoof fingerprint detection[J].Information Sciences,2014,268:130-139.
[13] 赵怀勋,徐 锋,陈家勇.基于多尺度LBP的人脸识别[J].计算机应用与软件,2012,29(1):257-259,279.
ZHAO Huaixun,XU Feng,CHEN Jiayong .Face recognition based on multi-scale LBP[J].Computer Applications and Software,2012,29(1):257-259,279.
[14] 康 健.基于多阈值多尺度LBP的人脸识别研究[D].北京:北京邮电大学,2013.
[15] 李春利,沈鲁娟.基于改进LBP算子的纹理图像分类方法[J].计算机工程与设计,2016,37(1):232-236.
LI Chunli,SHEN Lujuan.Texture image classification method based on improved LBP operator[J].Coputer Engineering and Design,2016,37(1):232-236.
[16] 杨文文,毛建旭,陈姜嘉旭.基于分块LBP和分块PCA的指静脉识别方法[J].电子测量与仪器学报,2016,30(7):1000-1007.
YANG Wenwen,MAO Jianxu,CHEN Jiangjiaxu.Finger vein recognition based on block LBP and block PCA[J].Journal of Electronic Measurement and Instruments,2016,30(7):1000-1007.
[17] 王 玮,黄非非,李见为,等.使用多尺度LBP特征描述与识别人脸[J].光学精密工程,2008(4):696-705.
[18] 王 红,武继刚,张 铮.基于二维MB-LBP特征的人脸识别[J].计算机工程与应用,2015,51(10):191-194.
WANG Hong,WU Jigang,ZHANG Zheng.Face recognition based on 2-dimensional MB-LBP characteristics[J].Computer Engineering and Applications,2015,51(10):191-194.
[19] MURALA Subrahmanyam,JONATHAN Wu Q M.Expert content-based image retrieval system using robust local patterns[J].Journal of Visual Communication and Image Representation,2014,25(6):8-13.
[20] 伍云霞,张 宏.基于Curvelet变换和压缩感知的煤岩识别方法[J].煤炭学报,2017,42(5):1331-1338.
WU Yunxia,ZHANG Hong.Coal and rock recognition method based on Curvelet transform and compressive sensing [J].Journal of China Coal Society,2017,42(5): 1331-1338.
[21] ARKO Lucieer,ALFRED Stein.Texture-based landform segmentation of LiDAR imagery[J].International Journal of Applied Earth Observations and Geoinformation,2004,6(3):100-107.
[22] LIN Fengyan,ZHENG Chunhou,WANG Xiaofeng,et al.Multiple classification of plant leaves based on gabor transform and LBP operator[M].Springer Berlin Heidelberg,2008.
[23] 孙继平,佘 杰.基于支持向量机的煤岩图像特征抽取与分类识别[J].煤炭学报,2013,38(S2):508-512.
SUNJiping,SHE Jie.Coal-rock imagefeature extraction and recognition based on support vector machine[J].Journal of China Coal Society,2013,38(S2):508-512.