期刊文章详细信息
改进YOLO11n和PaddleOCR的煤矿钻场视频自动剪辑方法
Automatic Video Editing Method for Coal Mine Drilling Site Based on Improved YOLO11n and PaddleOCR
文献类型:期刊文章
LI Xiaojun;LI Miao;ZHAO Mingyang(School of Energy Science and Engineering,Henan Polytechnic University,Jiaozuo,Henan 454003,China;Henan International Joint Laboratory of Coalmine Ground Control,Jiaozuo,Henan 454003,China;School of Innovation and Entrepreneurship,Henan Polytechnic University,Jiaozuo,Henan 454003,China)
机构地区:[1]河南理工大学能源科学与工程学院,河南焦作454003 [2]河南省煤矿岩层控制国际联合实验室,河南焦作454003 [3]河南理工大学创新创业学院,河南焦作454003
基 金:河南省高校科技创新团队支持计划项目(22IRTSTHN005)。
年 份:2025
卷 号:61
期 号:17
起止页码:209-221
语 种:中文
收录情况:BDHX、BDHX2023、核心刊
摘 要:为解决煤矿井下瓦斯抽采钻场监控视频数据规模大、传统人工剪辑效率低的问题,提出一种将YOLO11n和PaddleOCR相结合的视频自动剪辑方法。使用YOLO11n检测视频图像帧中的指示牌目标,并根据检测框坐标信息进行裁剪;将裁剪的目标区域输入PaddleOCR中进行文字识别;依据设定的剪辑逻辑规则对视频进行自动剪辑。为提升YOLO11n在煤矿井下复杂环境的检测精度,提出一种新的模块Faster-EMA来替代C3k2中的Bottleneck,引入FasterBlock及EMA注意力机制,增强多尺度特征表达能力并降低冗余计算;在C2PSA层后引入Triplet Attention,通过三分支结构捕获跨维交互来计算注意力权重,进一步增强特征提取效果;采用PIoUv2替代默认损失函数CIoU以解决锚框扩展问题。同时使用改进后的YOLO11n替换PaddleOCR中的文本检测算法DBNet,解决实时性不足问题。在自建的指示牌数据集上进行实验验证,结果表明,改进的YOLO11n对比原模型,mAP50提升4.8个百分点,且使用改进YOLO11n替代DBNet后视频平均处理速度提升51.0%,FPS达到37帧/s,满足实时性需求。研究实现了基于指示牌文字内容的钻场监控视频自动剪辑,为煤矿智能化发展提供了技术参考。
关 键 词:煤矿钻场 视频剪辑 文本识别 YOLO11n PaddleOCR
分 类 号:TP391.41]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...