期刊文章详细信息
基于互信息属性排序的不完整数据聚类算法
Incomplete Data Clustering Algorithm Based on Mutual Information Attributes Ranking
文献类型:期刊文章
QIAN Xiaodong;LUO Yanfu(Graduate School,Lanzhou Jiaotong University,Lanzhou 730070,China;School of Automation and Electrical Engineering,Lanzhou Jiaotong University,Lanzhou 730070,China)
机构地区:[1]兰州交通大学研究生院,甘肃兰州730070 [2]兰州交通大学自动化与电气工程学院,甘肃兰州730070
基 金:国家自然科学基金资助项目(71461017)
年 份:2019
卷 号:48
期 号:1
起止页码:80-87
语 种:中文
收录情况:BDHX、BDHX2017、CSCD、CSCD2019_2020、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:数据缺失对聚类算法提出了挑战,传统方法往往采用均值或回归方法将不完整数据进行填充,再对填充后的数据进行聚类.为解决均值填充和回归填充等方法在数据缺失比率增大时填充精度以及聚类效果变差的问题,提出一种新的不完整数据相似度计算方法.以期望互信息为依据对数据集中的属性排序,充分考虑了数据集中与位置相关的属性值特征,以数据集本身元素作为缺失值填充的来源,对排序后的不完整数据集进行相似度填充计算,最后采用基于局部密度的聚类算法进行聚类.利用UCI机器学习库中的数据集验证本文填充聚类算法,实验结果表明,当数据集中缺失值增多时,算法对缺失值的容忍性较好,对缺失元素的恢复能力较强,填充精度以及最终聚类结果方面均表现良好.本文填充计算相似度的方法考虑数据集的每个属性值来对缺失值逐个填充,因而耗时较多.
关 键 词:不完整数据 互信息 缺失值填充 局部密度
分 类 号:TP311.13]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...

