登录    注册    忘记密码

期刊文章详细信息

基于BERT的多特征融合农业命名实体识别  ( EI收录)  

Recognition of the agricultural named entities with multi-feature fusion based on BERT

  

文献类型:期刊文章

作  者:赵鹏飞[1] 赵春江[1,2] 吴华瑞[2,3,4] 王维[2,3]

Zhao Pengfei;Zhao Chunjiang;Wu Huarui;Wang Wei(School of Engineering,Shanxi Agricultural University,Taigu 030801,China;National Engineering Research Center for Information Technology in Agriculture,Beijing 100097,China;Beijing Research Center for Information Technology in Agriculture,Beijing 100097,China;Beijing Research Center of Intelligent Equipment for Agriculture,Beijing 100097,China)

机构地区:[1]山西农业大学工学院,太谷030801 [2]国家农业信息化工程技术研究中心,北京100097 [3]北京农业信息技术研究中心,北京100097 [4]北京农业智能装备技术研究中心,北京100097

出  处:《农业工程学报》

基  金:国家重点研发计划项目(2019YFD1101105);国家自然科学基金项目(61871041);北京市科技计划项目(Z191100004019007)。

年  份:2022

卷  号:38

期  号:3

起止页码:112-118

语  种:中文

收录情况:AJ、BDHX、BDHX2020、CAB、CAS、CSCD、CSCD2021_2022、EAPJ、EI、IC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊

摘  要:命名实体识别是农业文本信息抽取的重要环节,针对实体识别过程中局部上下文特征缺失、字向量表征单一、罕见实体识别率低等问题,提出一种融合BERT(Bidirectional Encoder Representations from Transformers,转换器的双向编码器表征量)字级特征与外部词典特征的命名实体识别方法。通过BERT预训练模型,融合左右两侧语境信息,增强字的语义表示,缓解一词多义的问题;自建农业领域词典,引入双向最大匹配策略,获取分布式词典特征表示,提高模型对罕见或未知实体的识别准确率;利用双向长短时记忆(Bi-directional Long-short Term Memory,BiLSTM)网络获取序列特征矩阵,并通过条件随机场(Conditional Random Field,CRF)模型生成全局最优序列。结合领域专家知识,构建农业语料集,包含5295条标注语料,5类农业实体。模型在语料集上准确率为94.84%、召回率为95.23%、F_(1)值为95.03%。研究结果表明,该方法能够有效识别农业领域命名实体,识别精准度优于其他模型,具有明显的优势。

关 键 词:农业 命名实体识别 文本 BERT  词典特征  BiLSTM  

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心