期刊文章详细信息
基于词项关联的短文本分类研究
The Research of Short Texts Classifi cation Based on Association Rules of Lexical Items
文献类型:期刊文章
机构地区:[1]天津海量信息技术有限公司,天津100029 [2]中国科学院深圳先进技术研究院,深圳518055 [3]中山大学信息科学与技术学院,广州510006
基 金:深圳市知识创新计划基础研究项目(JCYJ20130401170306838)
年 份:2015
卷 号:4
期 号:3
起止页码:69-78
语 种:中文
收录情况:JST、RCCSE、普通刊
摘 要:以短文本为主体的微博等社交媒体,因具备文本短、特征稀疏等特性,使得传统文本分类方法不能够高精度地对短文本进行分类。针对这一问题,文章提出了基于词项关联的短文本分类方法。首先对训练集进行强关联规则挖掘,将强关联规则加入到短文本的特征中,提高短文本特征密度,进而提高短文本分类精度。对比实验表明,该方法一定程度上减缓了短文本特征稀疏特点对分类结果的影响,提高了分类准确率、召回率和F1值。
关 键 词:数据挖掘 短文本 分类 关联规则
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...