登录    注册    忘记密码

期刊文章详细信息

基于人工特征和机器特征融合的科技文献知识元抽取    

Extracting Knowledge Elements of Sci-Tech Literature Based on Artificial and Machine Features

  

文献类型:期刊文章

作  者:柴庆凤[1,2] 史霖炎[2] 梅珊[2] 熊海涛[2] 贺惠新[1]

Chai Qingfeng;Shi Linyan;Mei Shan;Xiong Haitao;He Huixin(College of Computer Science and Technology,Huaqiao University,Quanzhou 361021,China;Tongfang Knowledge Network Technology Co.,Ltd.(Beijing),Beijing 100192,China)

机构地区:[1]华侨大学计算机科学与技术学院,泉州361021 [2]同方知网(北京)技术有限公司,北京100192

出  处:《数据分析与知识发现》

基  金:国家社会科学基金面上基金项目(项目编号:19BXW110)的研究成果之一。

年  份:2021

卷  号:5

期  号:8

起止页码:132-143

语  种:中文

收录情况:BDHX、BDHX2020、CSCD、CSCD_E2021_2022、CSSCI、CSSCI2021_2022、NSSD、RCCSE、RWSKHX、SCOPUS、ZGKJHX、核心刊

摘  要:【目的】基于深度学习的方法将科技文献的人工特征和机器特征进行融合,有效提升知识元抽取的效率。【方法】基于科技文献特征,构建26个人工特征指标,主要包括三个层面,即篇章、句子、字词,并将其与Word2Vec和one-hot等机器特征基于LSTM、CNN、BERT模型从横向、纵向进行特征融合,完成知识元抽取。【结果】特征纵向融合对知识元的抽取准确率最高约为0.91,与当时最传统方法效果相比提升约6个百分点。【局限】当数据量过大时,深度学习模型运行占用内存过大,需要后续进行优化。【结论】人工特征和机器特征纵向融合方式可以有效提升知识元抽取效果。

关 键 词:知识元抽取  人工特征  机器特征  科技文献  

分 类 号:G250[图书情报与档案管理类] TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心