期刊文章详细信息
基于残差注意网络的端到端手写文本识别方法 ( EI收录)
An end-to-end handwritten text recognition method using residual attention networks
文献类型:期刊文章
WANG Yin-tong;ZHENG Hao;CHANG He-you;LI Shuo(School of Information Engineering,Nanjing Xiaozhuang University,Nanjing 211171,China;College of Computer Science and Technology,Zhejiang University,Hangzhou 310058,China;Institute of Artificial Intelligence,De Montfort University,Leicester LE19BH,United Kingdom)
机构地区:[1]南京晓庄学院信息工程学院,南京211171 [2]浙江大学计算机科学与技术学院,杭州310058 [3]英国德蒙福特大学人工智能研究所,莱斯特LE19BH
基 金:国家自然科学基金项目(62177028,61976118,61806098);江苏省自然科学基金项目(BK20180142);江苏省青蓝工程项目.
年 份:2023
卷 号:38
期 号:7
起止页码:1825-1834
语 种:中文
收录情况:AJ、BDHX、BDHX2020、CSCD、CSCD2023_2024、EAPJ、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:中文手写文本识别是模式识别领域中的研究热点问题之一,其存在字符类别数量多、书写风格差异大和训练数据集标记难等问题.针对上述问题,提出无切分无循环的残差注意网络结构用于端到端手写文本识别.首先,以ResNet-26为主体结构,使用深度可分离卷积提取有意义特征,残差注意门控模块提升文本图像中的关键区域的重要性;其次,采用批量双线性插值模型对输入表征进行拉伸-挤压,实现二维文本表征到一维文本行表征的文本行上采样;最后,以连接时序分类作为识别模型的损失函数,实现高层次抽取表征与字符序列标记的对应关系.在CASIA-HWDB2.x和ICDAR2013两个数据集上进行实验研究,结果表明,所提方法在没有任何字符或文本行的位置信息时能够有效地实现端到端手写文本识别,且优于现有的方法.
关 键 词:手写文本识别 深度可分离卷积 残差注意门控 双线性插值 文本行上采样 连接时序分类
分 类 号:TP273]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...

