期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京工业大学信息学部软件学院
年 份:2019
卷 号:0
期 号:6
起止页码:24-25
语 种:中文
收录情况:普通刊
摘 要:TF-IDF算法作为最常见的特征权重计算方法被广泛使用。传统TF-IDF特征提取方法在文本分类任务中缺乏对类之间分布差异的体现。基于此种情况,立足于传统TF-IDF算法中根据词频来选择特征词的特性,本文提出一种新的基于卡方统计的特征词提取算法并通过改进后的新方法对文本分类模型进行评估。实验结果表明,新方法在查准率、查全率、F1值和ROC_AUC等评估结果上较传统特征提取方法有明显优化。
关 键 词:TF-IDF算法 文本分类 统计 特征提取 权重计算 分类模型 提取算法 特征词
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...