登录    注册    忘记密码

期刊文章详细信息

基于汉明距离的文本相似度计算    

Text Similarity Computing Based on Hamming Distance

  

文献类型:期刊文章

作  者:张焕炯[1] 王国胜[1] 钟义信[1]

机构地区:[1]北京邮电大学信息工程学院,北京100876

出  处:《计算机工程与应用》

基  金:国家自然科学基金资助项目(编号:69982001)

年  份:2001

卷  号:37

期  号:19

起止页码:21-22

语  种:中文

收录情况:AJ、BDHX、BDHX2000、CSA、CSA-PROQEUST、CSCD、CSCD2011_2012、IC、INSPEC、JST、RCCSE、ZGKJHX、核心刊

摘  要:传统的文本分类中相似度的计算,是根据欧氏空间中向量之间夹角的余弦值来表征的,它根据余弦值的大小来反映文本之间的相互关系。该文则首先建立文本集与码字集之间的1-1对应关系,然后借用编码理论中汉明距离的概念,由汉明距离的计算公式,得到了一种全新的文本相似度的计算方法,与传统的方法相比较,它具有简便,快速等优点。

关 键 词:INTERNET 汉明距离 文本相似度 信息检索 信息论  

分 类 号:TP393.4] G354.4[计算机类]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心