2014年6月24日 星期二     加入收藏 | 设为主页 | 首页

改进YOLOv5x的玻璃绝缘子掉串故障检测研究

来源:null  发布日期:2024-08-21     点击数:177

改进YOLOv5x的玻璃绝缘子掉串故障检测研究
任晓明1*,刘世源1,颜楠楠2,李登攀1,秦栋1
(1.上海电机学院 电气学院,上海 201306;2. 国网华东电力试验研究院有限公司,上海 200437)

摘  要:为提升复杂背景下无人机拍摄玻璃绝缘子的检测效果,提出一种改进YOLOv5x的检测模型。以原始YOLOv5x为基础,在主网络头部使用Conv层替换切片层提升复杂背景下的特征提取能力,主干中引入CA注意力模块提升小目标的识别和定位能力,将损失函数更换为DIOU增强模型回归效果,并基于实际应用环境对自制数据集进行扩增实验以提升模型泛化能力。实验表明,在自建玻璃绝缘子数据集检测任务中,相较于原始YOLOv5x,改进算法在保持较高准确率下,召回率提升20.73%、平均精度(mAP_0.5和mAP_0.5:0.95)分别提升13.97%和28.31%,并在实地航拍中验证算法可行性。
关键词:玻璃绝缘子;YOLOv5x;CA注意力模块;Conv层替换;DIOU损失函数;数据集扩增


0 引言
输配电线路是电力系统的重要组成部分,由于其长时间经受污秽、雷击、强风和鸟害等外界因素影响,线路上的各种元件会发生老化、疲劳的现象,如果不能及时发现和消除这些潜在隐患,则可能发展成各种严重故障,危害电力系统的正常运行。玻璃绝缘子是输电线路的重要组成部分,是唯一的电气绝缘和重要的结构支撑,能快速检测到玻璃绝缘子及其故障所在显得至关重要。传统人工巡检存在耗时长、高空作业困难等问题,尤其在复杂天气环境下更为凸显,而无人机技术的蓬勃发展为巡检工作提供了新思路。无人机巡检具有高效、灵活、廉价以及受限少等优点,但在检测精度上有所不足[1]。
无人机视角采集的绝缘子样本成像背景复杂,且掉串故障处的面积在画面中占比较小,这对检测工作而言是一项重大考验[2]。近年来,许多研究人员对绝缘子故障检测进行了研究。文献[3]使用二阶段处理的思想,先后使用FCN对图像预处理和构建改进的YOLOv3特征提取器,有效解决航拍图像中因复杂背景干扰导致对绝缘子检测准确率低的问题。文献[4]提出一种两阶段的Faster-RCNN,优化anchor和IOU后并进行投票平均,最终提升检测算法性能;文献[5]基于联合分量灰度化算法和深度学习的思路实现玻璃绝缘子的目标检测,改善因相近色干扰、不同光照条件下玻璃绝缘子颜色特征不明显导致检测效果不佳的问题;文献[6]使用一种针对绝缘子的胶囊网络,有效提升对绝缘子的检测性能。
以上均对绝缘子故障检测做出了一定的研究,但随着计算机图像检测技术的不断发展,检测算法也有了长足的进步,绝缘子的检测精度仍有提升空间。因此,本文以原始YOLOv5x检测模型为基础,对主干检测网络和损失函数进行优化以提升检测能力,并合理扩增数据集提升模型泛化性,使用自搭建无人机航拍平台实地航拍,验证实际检测效果。
1 YOLOv5x模型优化
YOLOv5检测模型在结构上可分为四个部分:输入端(Input)、特征提取网络(Backbone)、特征融合层(Neck)和预测端(Prediction),网络结构简图如图1所示[7]。
 
图1 YOLOv5的网络结构简图
原始YOLOv5网络根据深度和宽度的不同可分为n、s、m、l和x五个模型,网络复杂程度和检测效果依次提高,基本结构不变。其中Input主要对数据集以及待测图片进行预处理,包括Mosaic数据增强、自适应锚框计算自适应图片缩放等[8];Backbone网络作为模型的主干,主要负责提取输入样本中的特征信息以供后续阶段使用;Neck层采用了FPN+PAN的结构,构建了低层和高层特征信息之间相互融合的桥梁[9];Prediction包含3种尺度的预测框,通过GIOU损失函数进行边框回归计算[10]。
1.1 特征提取网络
Backbone主干提取网络是整个检测模型的核心所在,从Input端获取的原始输入图像后,首先经过Focus切片处理,将640×640×3的输入维度转化为320×320×12的小尺度多堆叠层输出。切片处理的目的是减少图片的输入尺寸,以提升后续卷积网络的计算速度。但经过实际测试表明,直接使用Conv卷积下采样的效果要远优于Focus切片操作。因此,为了增强网络对复杂背景中目标特征的提取能力,将网络架构中Focus模块替换成Conv层,使输入输出尺度对应,如图2所示。
 
图2  Conv替换Focus层
玻璃绝缘子的掉串故障在无人机视角下相对较小,检测算法往往对小目标的检测效果欠佳。因此,模仿人类大脑的工作机理引入注意力机制,使检测模型更侧重特定内容和特定位置。将Backbone中所有的C3层全部融合Coordinate Attention(CA)注意力模块后,可获得改进算法的主干特征提取网络架构,如图3所示。
 
图3 主干特征提取网络架构
CA将位置信息嵌入到通道注意力中,使得网络能够在更大的区域上进行注意力,且不需要大量计算。它能同时捕获跨通道信息、方向感知和位置感知的信息,帮助模型更加精准地定位和识别感兴趣的目标。CA将全局池化操作沿水平(H,1)和 (1,W)垂直方向进行分别池化操作,获得特征图关于x、y轴的位置信息,如式(1)和(2)所示。
   (1)
   (2)
其中,Zch为水平方向得到的一维特征,Zcw为垂直方向得到的一维特征,两种转换可以让注意力块在一个空间方向上获取长期依赖关系,并在另一个空间方向上保存精确的位置信息,有助于网络更准确地定位感兴趣的对象。将式(1)和(2)的池化结果连接并进行一个1×1卷积融合处理,如式(3)所示。
   (3)
F1为水平和垂直池化结果的融合操作,r是一个控制模块大小的超参数,经过激活函数获得非线性的数据之后,再将输出的结果重新按照水平和垂直方向分为两组特征图,如式(4)和(5)所示。
   (4)
   (5)
分别经过1×1卷积操作后,利用sigmoid函数获得注意力权重数据,最后将输入的特征数据与水平和垂直权重相乘获得坐标注意力输出特征图数据,如式(6)所示。
   (6)
如上所述,沿水平和垂直方向的注意力特征同时应用于输入张量,两个注意图中的每个元素都反映了感兴趣的对象是否存在于相应的行和列中,这种编码过程可以使CA更准确地定位感兴趣对象的确切位置,从而帮助整个模型更好地识别。
1.2 损失函数
对于一张图片而言,YOLOv5不仅需要找到目标在图片中的相对位置,还应确定其对应的类别。基于此,YOLOv5中包含了三种损失函数:定位损失(Localization loss)、分类损失(Classification loss)和置信度损失(Confidence loss),最终结果以三者的加权之和表示,如式(7)所示。
   (7)
YOLOv5使用IOU指标来计算定位损失,用BCE-Loss评价分类损失和置信度损失[11]。
对于定位损失,IOU是必不可少的基础,即表示预测框(记为A)和真是框(记为B)的交并比。在此基础上,GIOU会额外添加一个完全包闭预测框和真实框的最小方框(记为C),之后计算C-(A∪B)的面积与C面积的比值,在利用A和B的IOU减去该值即可进一步得到GIOU以及定位损失函数,如式(8)所示。
   (8)
但是GIOU严重依赖IOU,当A1和B属于包含关系时,GIOU与IOU差值趋于0,导致收敛较慢,而且当A2相对于A1在水平和垂直方向存在偏移时,此时两者损失值虽然相同,但无法区分与B的相对位置关系,最终可能导致定位效果变差,如图4所示[12]。
 
图4 GIOU示意图
针对以上问题,DIOU在此基础上引入方框的欧式距离,将目标与方框之间的距离、重叠率以及尺度都考虑进去,使得目标框回归变得更加稳定,加速收敛,不会像GIOU一样出现训练过程中发散等问题,如式(9)所示。
   (9)
其中,b和bgt分别表示预测框和真实框的中心点,ρ表示两个中心点间的欧式距离,c代表可以同时包含预测框和真实框的最小包闭区域的对角线距离[13]。而CIOU在DIOU的基础上将长宽比也考虑进去[14]。
1.3 性能指标
对一个物体进行检测,其结果可能预测正确,也可能预测错误,正类预测为正类记为真正类(True Positive,TP),预测为负类记为真负类(True Negative,TN);负类预测为正类记为假负类(False Negative,FN),预测为负类记为真负类(True Negative,TN)。此时,准确率(Precision,P)和召回率(Recall,R)如式(10)所示。
   (10)
平均精度(Mean average precision,mAP)中mAP_0.5表示当IOU取0.5时,所有类别的P-R曲线下方面积之和的均值,mAP_0.5:0.95表示IOU从0.5取到0.95时所有mAP的均值。P反映了验证集对于训练集检测的查准程度,该值越高,证明检测越精准;R反映了对验证集的漏检程度;mAP_0.5相对于P和R更能反映全局性能,曲线围城的面积越大,模型综合性能越佳,mAP_0.5:0.95效用与前者类似,是一种对全局表现更加全面的性能指标。基于此,本次实验采用这4种评价指标,后两者更能表现模型的最终性能。
经过自制数据集以及相同环境测试2.2节所述的三种IoU后表明,在原始YOLOv5下DIOU更适用于检测工作,结果如表1所示。
表1  损失函数对比
IOU categories P R mAP_0.5 mAP_0.5:0.95
GIOU 0.926 0.685 0.766 0.438
CIOU 0.877 0.704 0.764 0.422
DIOU 0.917 0.737 0.787 0.456
1.4 数据集扩增
数据集的质量和数量对检测模型的性能有很大的影响,自制数据集由国网华东电力试验研究院有限公司提供,从近5000张不同角度类型的电力玻璃绝缘子航拍图片中筛选出501张作为原始数据,图片效果如图5所示。该数据集由真实航拍所得到的图像,与现场工况相对应,非常适合模型训练。
 
图5 部分数据集展示
考虑到实际场景中可能出现的泛光、逆光以及雾霾场景下的采集情况,基于OpenCV对图片进行处理,通过高斯雾化和通道数字调整来扩充数据集数量,分别模拟出高光、暗光以及模糊雾化效果的数据集样本(后文简称Light-haze),增强效果如图6所示[15]。
 
(a)
 
(b)
 
(c)
图6 雾霾增强(a)、泛光增强(b)、逆光增强(c)
2 实验与测试
2.1 实验平台
将自制数据集通过labelimg标注后,按照6:2:2的比例分为训练集、验证集和测试集,分为Insulator和fault两类检测,以下所有实验均在输入尺寸为640×640下进行,其他参数保持一致下达到收敛。本实验的软硬件平台参数如下表2所示。
表2 基础模型数据
Hardware category Models
处理器 Intel Core i7-10700K
显卡 NVIDIA GeForce RTX 3060
操作系统 Windows 10
模型框架 Pytorch
运行内存 16GB
2.2 实验与分析
以YOLOv5x网络为baseline参照,分析各个改进对性能的影响,将Conv、DIOU、Light-haze和CA引入后进行训练实验,利用余弦退火算法对学习率进行调整,训练至60个epoch模型基本达到收敛。训练结果如图7所示。
 
图7 mAP_0.5:0.95结果
从图中可以发现,对于综合指标mAP_0.5:0.95,在引入Conv卷积替换后存在较大幅度的提升,其他改进手段均对模型有益,在总体上呈现一个向上的趋势。将各阶段模型在测试集上进行测试,详细结果如表3所示。
表3 实验数据结果
Models P R mAP_0.5 mAP_0.5:0.95
Baseline 0.926 0.685 0.766 0.438
Baseline+
DIoU 0.917 0.737 0.787 0.456
Baseline+
DIoU+Conv 0.916 0.781 0.845 0.535
Baseline+
DIoU+Conv+Light-haze 0.924 0.817 0.866 0.553
Baseline+
DIoU+Conv+Lighthaze+
CA 0.923 0.827 0.863 0.562
从表3数据可知,相较于Baseline而言,Conv和DIOU的加入虽然损失了部分精度,但漏检情况明显改善,在此基础上Light-haze的引入使精度有所回调,且平均精度达到最佳效果,引入CA后,R和mAP_0.5:0.95取得最佳效果。在P保持较高水平的同时,R提升了20.73%,mAP_0.5提升了13.97%,mAP_0.5:0.95提升了28.31%。
为了进一步验证性能,将改进模型与目前使用较为广泛的YOLOv3[16]、YOLO4、YOLOv5x基本模型作对比,结果汇总如表4所示。
表4  模型性能对比
Models P R mAP_0.5 mAP_0.5:0.95
Yolov3 0.925 0.775 0.831 0.509
Yolov4 0.896 0.845 0.852 0.525
Yolov5 0.926 0.685 0.766 0.438
Ours 0.923 0.827 0.873 0.562
从表4可知,虽然优化算法的准确率相较于最优的YOLOv5在下降0.32%,召回率相较于最优的YOLOv4下降2.18%,但是mAP_0.5和mAP_0.5:0.95相较于最优值分别提升2.46%和7.05%。
2.3 实地航拍验证
由于输电线路是国家电力系统重要设施,按照相关规定是不允许私人随意进行拍摄,但是为了真实评估模型性能,必须将无人机和检测模型用于真实的线路。因此在与上海市电力设计院进行协商并得到同意以后,对合兴-朱松线路(未加电)进行无人机输电线路的实际航拍,现场如图8所示。
 
图8 合兴-朱松线路进行无人机航拍
合兴-朱松输电线路位于上海市金山区,为双回架空线路,路径全长约为24.6km,新建架空线路采用同塔双回路塔,其中新建的杆塔类型主要有:钢管杆、直线塔、转角塔和终端塔,输电线路型号为JL1/LHA1-465/210铝合金芯铝绞线,图9和图10展示的是无人机采集并筛选后的60张有效样片的检测效果。
 
图9检测结果对比
 
图10检测局部放大展示
从检测结果可以看出,有效视野内的绝缘子均被有效检测,但是由于合兴-朱松输电线路是全新架设线路,不存在绝缘子掉串故障现象,使用优化模型对测试集做掉串故障检测时效果如图11所示,绝缘子以及故障均可正常检测。
 
图11 掉串故障检测结果
3 结束语
本文提出的优化模型基于YOLOv5目标检测算法,可准确的确定绝缘子及其故障位置,使电力巡线高效化、智能化。以Yolov5x网络模型作为基础,将Focus替换为Conv、对数据集进行合理扩增以及引入DIOU和CA注意力机制。实验结果表明,本文优化的模型相较于原始YOLOv5x在综合性能上有了较大的提升,在保持P高水平的情况下,R提升了20.73%,mAP_0.5提升了13.97%,mAP_0.5:0.95提升了28.31%,并在上海市金山区的合兴-朱松输电线路处进行实际性能测试。另外,本文优化模型仅完成对绝缘子及其掉串故障的检测任务,未来考虑增加更多的输电线路金具以及对应故障的检测任务。

参考文献:
[1] 隋宇,宁平凡,牛萍娟,等.面向架空输电线路的挂载无人机电力巡检技术研究综述[J].电网技术,2021, 45(09):3636-3648.
[2] 赵睿,刘辉,刘沛霖,等.基于改进YOLOv5s的安全帽检测算法[J].北京航空航天大学学报,2023,49(8): 2050-2061.
[3] 王卓,王玉静,王庆岩,等.基于协同深度学习的二阶段绝缘子故障检测方法[J].电工技术学报,2021,36(17): 3594-3604.
[4] 丘灵华,朱铮涛.基于深度学习的输电线路绝缘子缺陷检测研究[J].计算机应用研究,2020,37(S1): 358-360+365.
[5] 黄新波,高玉菡,张烨,等.基于联合分量灰度化算法和深度学习的玻璃绝缘子目标识别算法[J].电力自动化设备,2022,42(04):203-209.
[6] 卞建鹏,李凡,郝培旭,等.复杂环境下输电线路绝缘子的破损识别与定位[J].高电压技术,2022,48(02):681-688.
[7] 郝帅,杨磊,马旭等.基于注意力机制与跨尺度特征融合的YOLOv5输电线路故障检测[J].中国电机工程学报,2023,43(06):2319-2331.
[8] 郭磊,王邱龙,薛伟,等.基于改进YOLOv5的小目标检测算法[J].电子科技大学学报,2022,51(02):251-258.
[9] 李彬,汪诚,丁相玉等.改进YOLOv4的表面缺陷检测算法[J].北京航空航天大学学报,2023,49(03):710-717.
[10] 律方成,牛雷雷,王胜辉等.基于优化YOLOv4的主要电气设备智能检测及调参策略[J].电工技术学报,2021,36(22):4837-4848.
[11] 聂鹏,肖欢,喻聪.YOLOv5预测边界框分簇自适应损失权重改进模型[J].控制与决策,2023,38(03):645-653.
[12] 侯志强,刘晓义,余旺盛,等.使用GIoU改进非极大值抑制的目标检测算法[J].电子学报,2021,49(04):696-705.
[13] 宋欣,李奇,解婉君,等.YOLOv3-ADS:一种基于YOLOv3的深度学习目标检测压缩模型[J].东北大学学报(自然科学版),2021,42(05):609-615.
[14] 高明华,杨璨.基于改进卷积神经网络的交通目标检测方法[J].吉林大学学报(工学版),2022,52(06): 1353-1361.
[15] Gollapudi S, Gollapudi S. OpenCV with Python[J]. Learn Computer Vision Using OpenCV: With Deep Learning CNNs and RNNs, 2019: 31-50.
[16] ul Haq Q M, Ruan S J, Haq M A, et al. An incremental learning of YOLOv3 without catastrophic forgetting for smart city applications[J]. IEEE Consumer Electronics Magazine, 2021, 11(5): 56-63.
               
作者简介:
任晓明(1977年9月),男,籍贯浙江省绍兴市(县)人,博士,副教授,高电压测试技术与雷电防护,E-mail:renxm@sdju.edu.cn
注:(作者联系方式:任晓明,19121657532,renxm@sdju.edu.cn,上海市临港水华路300号,邮编200120)
 

 


版权所有:上海市电机工程学会
地址:上海市南昌路47号3号楼3305室 邮件:200020
电话:021-53066896 传真:021-53066896