登录    注册    忘记密码

期刊文章详细信息

基于词项关联的短文本分类研究    

The Research of Short Texts Classifi cation Based on Association Rules of Lexical Items

  

文献类型:期刊文章

作  者:章昉[1,2] 颜华驹[3] 刘明君[2] 赵中英[2]

机构地区:[1]天津海量信息技术有限公司,天津100029 [2]中国科学院深圳先进技术研究院,深圳518055 [3]中山大学信息科学与技术学院,广州510006

出  处:《集成技术》

基  金:深圳市知识创新计划基础研究项目(JCYJ20130401170306838)

年  份:2015

卷  号:4

期  号:3

起止页码:69-78

语  种:中文

收录情况:JST、RCCSE、普通刊

摘  要:以短文本为主体的微博等社交媒体,因具备文本短、特征稀疏等特性,使得传统文本分类方法不能够高精度地对短文本进行分类。针对这一问题,文章提出了基于词项关联的短文本分类方法。首先对训练集进行强关联规则挖掘,将强关联规则加入到短文本的特征中,提高短文本特征密度,进而提高短文本分类精度。对比实验表明,该方法一定程度上减缓了短文本特征稀疏特点对分类结果的影响,提高了分类准确率、召回率和F1值。

关 键 词:数据挖掘 短文本  分类  关联规则

分 类 号:TP391.1]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心