期刊文章详细信息
文献类型:期刊文章
机构地区:[1]苏州大学计算机科学与技术学院,江苏苏州215006 [2]江苏省计算机信息处理技术重点实验室,江苏苏州215006
基 金:国家自然科学基金(60673041;60873150);江苏省高校自然科学重大基础研究项目(08KJA520002)
年 份:2011
卷 号:28
期 号:10
起止页码:20-22
语 种:中文
收录情况:CSA、CSA-PROQEUST、CSCD、CSCD_E2011_2012、IC、JST、ZGKJHX、普通刊
摘 要:近年来概率主题模型受到了研究者的广泛关注,LDA(Latent Dirichlet Allocation)模型是主题模型中具有代表性的概率生成模型之一,它能够检测文本的隐含主题。提出一个基于LDA模型的主题特征,该特征计算文档的主题分布与句子主题分布的距离。结合传统多文档自动文摘中的常用特征,计算句子权重,最终根据句子的分值抽取句子形成摘要。实验结果证明,加入LDA模型的主题特征后,自动文摘的性能得到了显著的提高。
关 键 词:自动文摘 LDA 主题模型 多文档
分 类 号:TP301]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...