复杂背景下基于改进YOLO v8s的混凝土桥梁裂缝检测方法

蒋仕新 邹小雪 杨建喜 李昊 黄雪梅 李韧 张廷萍 刘新龙 王笛

JIANG Shi-xin, ZOU Xiao-xue, YANG Jian-xi, LI Hao, HUANG Xue-mei, LI Ren, ZHANG Ting-ping, LIU Xin-long, WANG Di. Concrete bridge crack detection method based on improved YOLO v8s in complex backgrounds[J]. Journal of Traffic and Transportation Engineering, 2024, 24(6): 135-147. doi: 10.19818/j.cnki.1671-1637.2024.06.009
复杂背景下基于改进YOLO v8s的混凝土桥梁裂缝检测方法

国家自然科学基金项目 62003063

国家自然科学基金项目 62103068

重庆市自然科学基金项目 CSTB2022NSCQ-MSX1599

重庆市自然科学基金项目 cstc2020jcyj-msxmX0047

重庆市教育委员会科学技术研究项目 KJZD-K202400709

重庆市教育委员会科学技术研究项目 KJZD-M202300703

重庆市教育委员会科学技术研究项目 KJQN202100748



  • 中图分类号: U446

Concrete bridge crack detection method based on improved YOLO v8s in complex backgrounds


National Natural Science Foundation of China 62003063

National Natural Science Foundation of China 62103068

Natural Science Foundation of Chongqing CSTB2022NSCQ-MSX1599

Natural Science Foundation of Chongqing cstc2020jcyj-msxmX0047

Science and Technology Research Project of Chongqing Municipal Education Commission KJZD-K202400709

Science and Technology Research Project of Chongqing Municipal Education Commission KJZD-M202300703

Science and Technology Research Project of Chongqing Municipal Education Commission KJQN202100748

  • 摘要: 针对混凝土桥梁裂缝因背景复杂、细小模糊导致检测精度较差的问题,提出了一种基于改进YOLO v8s的混凝土桥梁裂缝检测算法, 精确定位了裂缝位置信息,并测量了裂缝长、宽等关键参数;以YOLO v8s模型为基础,引入全维度动态卷积(ODConv)获取特征图中更丰富的上下文信息,以增强目标特征提取能力,提高对细小模糊裂缝的检测能力; 采用改进通道注意力模块构建了级联双层特征改进注意力(C2f-MA)融合模块,以挖掘特征图中更多的纹理信息,进一步使网络更加关注裂缝特征,从而抑制无关背景信息的干扰,提高复杂背景下的裂缝检测效果;使用焦距交并比(WIoU)损失函数来解决低质量样本的识别问题,进一步优化了模型的收敛速度和检测准确率;在桥梁检测报告中筛选出存在裂缝细小模糊、阴影、人工画线、杂草等具有复杂背景的裂缝图像,通过人工标注的方式建立了复杂背景条件下桥梁裂缝图像数据集;以召回率、平均精度和模型存储容量作为量化评价指标,并依次通过对比试验及消融试验来对模型进行综合评估。研究结果表明:改进YOLO v8s算法的召回率、平均精度和模型存储容量分别为0.829、0.893和11.14 MB,其综合评价指标优于基准方法YOLO v8s和其他目标检测模型,证明了提出的算法在复杂背景下具有良好的鲁棒性。


  • 图  1  改进YOLO v8s网络结构

    Figure  1.  Improved YOLO v8s network structure

    图  2  CIoU和WIoU损失函数

    Figure  2.  Loss functions of CIoU and WIoU

    图  3  ODConv结构

    Figure  3.  ODConv structure

    图  4  C2f-MA结构

    Figure  4.  C2f-MA structure

    图  5  桥梁裂缝标注

    Figure  5.  Bridge crack annotations

    图  6  两种算法的P-R曲线对比

    Figure  6.  Comparison of P-R curves between two algorithms

    图  7  裂缝识别结果对比

    Figure  7.  Comparison of crack recognition results

    图  8  多种目标检测算法对比结果

    Figure  8.  Comparison of results from multiple target detection algorithms

    图  9  裂缝提取主骨架结果

    Figure  9.  Result of crack extraction of main skeleton

    图  10  八邻域示意

    Figure  10.  Schematic of eight-neighborhood

    图  11  沿主骨架线方向的裂缝宽度热力图

    Figure  11.  Crack width heatmap along main skeleton line direction

    图  12  裂缝长度测量结果

    Figure  12.  Crack length measurement results

    表  1  试验环境

    Table  1.   Experimental environment

    名称 型号
    显卡(GPU) NVIDIA Quadro RTX 3090
    显存/GB 24
    操作系统 Ubuntu 20.04
    Pytorch 1.10.0
    Python 3.8.16
    CUDA 11.3
    Torchvision 0.11.1
    表  2  YOLO v8s与改进YOLO v8s性能对比

    Table  2.   Performance comparison between YOLO v8s and improved YOLO v8s

    方法 R P0.5 P0.5∶0.95 帧率/(帧·s-1) 模型存储容量/MB
    YOLO v8s 0.789 0.857 0.586 139 11.13
    改进YOLO v8s 0.829 0.893 0.631 123 11.14
    表  3  消融试验结果

    Table  3.   Results of ablation experiments

    试验编号 WIoU ODConv C2f-MA R P0.5 P0.5∶0.95 帧率/(帧·s-1) 模型存储容量/MB
    1 × × × 0.789 0.857 0.586 139 11.13
    2 × × 0.821 0.871 0.595 143 11.13
    3 × × 0.823 0.872 0.611 135 11.14
    4 × × 0.808 0.878 0.600 128 11.13
    5 × 0.827 0.879 0.613 141 11.14
    6 0.829 0.893 0.631 123 11.14
    表  4  C2f-MA模块不同位置消融对比结果

    Table  4.   Comparison of ablation experiment results of C2f-MA module at different locations

    试验编号 R P0.5 P0.5∶0.95 帧率/(帧·s-1) 模型存储容量/MB
    1 0.823 0.884 0.619 130 11.13
    2 0.823 0.887 0.623 132 11.13
    3 0.829 0.893 0.631 123 11.14
    表  5  WIoU超参数对试验结果的影响

    Table  5.   Effects of WIoU hyperparameters on experimental results

    α δ R P0.5 P0.5∶0.95
    2.3 2 0.833 0.887 0.620
    1.9 3 0.810 0.877 0.605
    1.6 4 0.829 0.893 0.631
    1.4 5 0.825 0.890 0.627
    1.3 6 0.830 0.886 0.625
    表  6  多种目标检测算法结果对比

    Table  6.   Comparison of results from multiple target detection algorithms

    方法 R P0.5 P0.5∶0.95 模型存储容量/MB
    Faster R-CNN 0.302 0.449 0.232 41.35
    Deformable DETR 0.582 0.810 0.464 40.10
    YOLO v8-GAM-Wise-IoU 0.763 0.832 0.544 12.87
    DINO 0.687 0.858 0.585 47.54
    改进YOLO v8s 0.829 0.893 0.631 11.14
