登录    注册    忘记密码

期刊文章详细信息

基于卡方统计改进的TF-IDF的文本分类的研究    

  

文献类型:期刊文章

作  者:王露瑶[1] 张涛[1] 陈才[1] 朱安琥[1] 罗启明[1]

机构地区:[1]北京工业大学信息学部软件学院

出  处:《电子世界》

年  份:2019

卷  号:0

期  号:6

起止页码:24-25

语  种:中文

收录情况:普通刊

摘  要:TF-IDF算法作为最常见的特征权重计算方法被广泛使用。传统TF-IDF特征提取方法在文本分类任务中缺乏对类之间分布差异的体现。基于此种情况,立足于传统TF-IDF算法中根据词频来选择特征词的特性,本文提出一种新的基于卡方统计的特征词提取算法并通过改进后的新方法对文本分类模型进行评估。实验结果表明,新方法在查准率、查全率、F1值和ROC_AUC等评估结果上较传统特征提取方法有明显优化。

关 键 词:TF-IDF算法  文本分类 统计  特征提取 权重计算  分类模型  提取算法  特征词

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心