登录    注册    忘记密码

期刊文章详细信息

融合音节部件特征的藏文命名实体识别方法    

Fusion of syllable component features for Tibetan named entity recognition

  

文献类型:期刊文章

作  者:洛桑嘎登[1] 群诺[1] 索南尖措[1] 仁增多杰[1]

LUOSANG Gadeng;QUN Nuo;SUONAN Jiancuo;RENZENG Duojie(College of Information Science and Technology,Tibet University,Lhasa 850000,China)

机构地区:[1]西藏大学信息科学技术学院,西藏拉萨850000

出  处:《厦门大学学报(自然科学版)》

基  金:国家重点研发计划重点专项(2017YFB1402200);西藏自治区自然基金项目(XZ2017ZRG08);2021年武汉理工大学、西藏大学、西藏经济社会发展与高原科学研究共建创新基金专项(lzt202100);中央引导地方科技发展资金项目(ZX202102YD0018C);西藏大学成长计划(08000013);西藏大学培育基金(ZDCZJH8-16);西藏大学在职攻读博士学位资助项目,藏才预指(2022)1号。

年  份:2022

卷  号:61

期  号:4

起止页码:624-629

语  种:中文

收录情况:AJ、BDHX、BDHX2020、CAS、CSCD、CSCD_E2021_2022、JST、MR、RCCSE、WOS、ZGKJHX、ZMATH、核心刊

摘  要:藏文命名实体识别是藏语自然语言处理的基础任务,是完成机器翻译、网络舆情检测和知识图谱构建等任务的前提.传统的基于深度学习的藏文命名实体识别将藏文音节(字嵌入)作为模型输入的方法容易忽略藏文音节的局部特征.针对这一问题,本文提出了一种融合构成藏文音节部件特征和藏文音节特征的藏文命名实体识别神经网络模型SL-BiLSTM-CRF(syllable level long short-term memory conditional random field).其中,SL模块对构成音节的部件信息和藏文的单个音节进行特征编码,将两种不同模态的特征融合之后送入BiLSTM模型进行特征提取并预测实体标签,再通过CRF对BiLSTM模型的预测结果进行矫正,最终输出藏文实体识别结果.实验证明,该方法在藏文命名实体识别任务中相比基于单个藏文音节(字嵌入)的BiLSTM-CRF模型的F_(1)值提高了1.58个百分点,验证了该方法在藏文命名实体识别任务中的有效性.

关 键 词:音节部件特征  藏文命名实体识别  深度学习  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心