登录    注册    忘记密码

期刊文章详细信息

改进YOLO11n和PaddleOCR的煤矿钻场视频自动剪辑方法    

Automatic Video Editing Method for Coal Mine Drilling Site Based on Improved YOLO11n and PaddleOCR

  

文献类型:期刊文章

作  者:李小军[1,2] 李淼[1,3] 赵明炀[1,3]

LI Xiaojun;LI Miao;ZHAO Mingyang(School of Energy Science and Engineering,Henan Polytechnic University,Jiaozuo,Henan 454003,China;Henan International Joint Laboratory of Coalmine Ground Control,Jiaozuo,Henan 454003,China;School of Innovation and Entrepreneurship,Henan Polytechnic University,Jiaozuo,Henan 454003,China)

机构地区:[1]河南理工大学能源科学与工程学院,河南焦作454003 [2]河南省煤矿岩层控制国际联合实验室,河南焦作454003 [3]河南理工大学创新创业学院,河南焦作454003

出  处:《计算机工程与应用》

基  金:河南省高校科技创新团队支持计划项目(22IRTSTHN005)。

年  份:2025

卷  号:61

期  号:17

起止页码:209-221

语  种:中文

收录情况:BDHX、BDHX2023、核心刊

摘  要:为解决煤矿井下瓦斯抽采钻场监控视频数据规模大、传统人工剪辑效率低的问题,提出一种将YOLO11n和PaddleOCR相结合的视频自动剪辑方法。使用YOLO11n检测视频图像帧中的指示牌目标,并根据检测框坐标信息进行裁剪;将裁剪的目标区域输入PaddleOCR中进行文字识别;依据设定的剪辑逻辑规则对视频进行自动剪辑。为提升YOLO11n在煤矿井下复杂环境的检测精度,提出一种新的模块Faster-EMA来替代C3k2中的Bottleneck,引入FasterBlock及EMA注意力机制,增强多尺度特征表达能力并降低冗余计算;在C2PSA层后引入Triplet Attention,通过三分支结构捕获跨维交互来计算注意力权重,进一步增强特征提取效果;采用PIoUv2替代默认损失函数CIoU以解决锚框扩展问题。同时使用改进后的YOLO11n替换PaddleOCR中的文本检测算法DBNet,解决实时性不足问题。在自建的指示牌数据集上进行实验验证,结果表明,改进的YOLO11n对比原模型,mAP50提升4.8个百分点,且使用改进YOLO11n替代DBNet后视频平均处理速度提升51.0%,FPS达到37帧/s,满足实时性需求。研究实现了基于指示牌文字内容的钻场监控视频自动剪辑,为煤矿智能化发展提供了技术参考。

关 键 词:煤矿钻场  视频剪辑 文本识别 YOLO11n  PaddleOCR  

分 类 号:TP391.41]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心