期刊文章详细信息
基于改进Single-Pass的新闻话题检测与追踪技术研究
Research on News Topic Detection and Tracking Technology Based on Improved Single-Pass
文献类型:期刊文章
Zhang Fan;Pan Yaxiong;Hu Yong(College of Cybersecurity,Sichuan University,Chengdu 610065;Chengdu Science and Technology Development Center of China Academy of Engineering and Physics,Chengdu 610200)
机构地区:[1]四川大学网络空间安全学院,成都市610065 [2]中物院成都科学技术发展中心,成都市610041
年 份:2020
卷 号:6
期 号:5
起止页码:396-403
语 种:中文
收录情况:NSSD、RCCSE、ZGKJHX、普通刊
摘 要:为解决如何从海量新闻报道中检测并追踪到目标话题,选择了自增式聚类Single-Pass算法进行研究.在原有的基础上对其进行改进得到改进后的Single-Pass聚类算法,期望能得到更好的解决方法.对于原有算法进行的改进主要有在新闻文本的特征词选取中加入权重系数表达特征词位置信息,同时辅以时间特征进行新闻文本相似度计算,并且在Single-Pass聚类算法步骤中添加子话题阈值判断过程.实验验证改进后的Single-Pass聚类算法不仅可得到不同粒度的话题聚类效果,同时也提升了聚类效率.实验结果证明,在相同条件下,改进后的Single-Pass聚类算法在漏检率和误检率上有明显的改善.
关 键 词:新闻话题 Single-Pass聚类算法 时间特征 相似度 子话题
分 类 号:TP391.1]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...