期刊文章详细信息
文献类型:期刊文章
机构地区:[1]北京大学机器感知与智能教育部重点实验室,北京100871 [2]北京市朝阳区档案局,北京100020
基 金:国家自然科学基金资助项目(60535030;60605016);国家"863"计划基金资助项目(2006AA012196);北京市档案科技基金资助项目(2009-13)
年 份:2010
卷 号:36
期 号:21
起止页码:4-6
语 种:中文
收录情况:AJ、BDHX、BDHX2008、CAS、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、SCOPUS、UPD、ZGKJHX、核心刊
摘 要:针对档案领域的短文本分类,设计一种基于概念网络的自动分类方法。通过分析领域内短文本的语言特点构建领域本体,利用自然语言处理技术将短文本转化为资源描述框架表示的结构化概念网络,在此基础上定义概念网络间的语义相似度,从而实现档案的自动分类。实验结果表明,相比传统基于特征选择的短文本分类方法,该方法的分类错误率下降了24.2%,可有效改善系统性能。
关 键 词:短文本分类 概念网络 文档相似度 领域本体
分 类 号:TP393]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...

