期刊文章详细信息
文献类型:期刊文章
机构地区:[1]南京工业大学信息科学与工程学院,南京210009 [2]安徽师范大学信息管理中心,安徽芜湖241000
基 金:国家自然科学基金资助项目(60703071);安徽省高校省级自然科学研究重点项目(KJ2009A63)
年 份:2010
卷 号:27
期 号:2
起止页码:472-474
语 种:中文
收录情况:AJ、BDHX、BDHX2008、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、UPD、ZGKJHX、ZMATH、核心刊
摘 要:从可信计算角度,提出一种可靠信任推荐文本分类特征权重算法,分析了特征在文档中的特性,基于Beta分布函数研究了特征与文档类之间的信任关系,建立特征权重计算模型,并实现简单高效的线性文本分类器。在比较实验中采用20newsgroup和复旦中文语料集。与TFIDF算法进行性能比较,实验结果显示该算法性能较TFIDF显著提高,并对非平衡语料具有良好的适应性。
关 键 词:文本分类 特征权重 可信计算 概率确定性密度 自然语言处理
分 类 号:TP181]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...