登录    注册    忘记密码

期刊文章详细信息

基于改进TF-IDF和ABLCNN的中文文本分类模型    

Chinese Text Classification Model Based on Improved TF-IDF and ABLCNN

  

文献类型:期刊文章

作  者:景丽[1] 何婷婷[1]

JING Li;HE Ting-ting(School of Computer and Information Engineering,Henan University of Economics and Law,Zhengzhou 450000,China)

机构地区:[1]河南财经政法大学计算机与信息工程学院,郑州450000

出  处:《计算机科学》

基  金:国家自然科学基金(61806073)。

年  份:2021

卷  号:48

期  号:S02

起止页码:170-175

语  种:中文

收录情况:BDHX、BDHX2020、CSCD、CSCD_E2021_2022、IC、JST、RCCSE、UPD、ZGKJHX、核心刊

摘  要:文本分类是自然语言处理领域中的重要内容,常用于信息检索、情感分析等领域。针对传统的文本分类模型文本特征提取不全面、文本语义表达弱的问题,提出一种基于改进TF-IDF算法、带有注意力机制的长短期记忆卷积网络(Attention base on Bi-LSTM and CNN,ABLCNN)相结合的文本分类模型。该模型首先利用特征项在类内、类间的分布关系和位置信息改进TF-IDF算法,突出特征项的重要性,并结合Word2vec工具训练的词向量对文本进行表示;然后使用ABLCNN提取文本特征,ABLCNN结合了注意力机制、长短期记忆网络和卷积神经网络的优点,既可以有重点地提取文本的上下文语义特征,又兼顾了局部语义特征;最后,将特征向量通过softmax函数进行文本分类。在THUCNews数据集和online_shopping_10_cats数据集上对基于改进TF-IDF和ABLCNN的文本分类模型进行实验,结果表明,所提模型在两个数据集上的准确率分别为97.38%和91.33%,高于其他文本分类模型。

关 键 词:文本分类 TF-IDF 卷积神经网络 注意力机制  长短期记忆网络  

分 类 号:TP391]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心