期刊文章详细信息
基于K-Means聚类算法的HDMA数据挖掘方法
High-Dimensional Mixed Attribute Data Mining Method Based on K-Means Clustering Algorithm
文献类型:期刊文章
GENG De-zhi;XU Qian(Department of Information Technology and Engineering,Jinzhong College,Jinzhong Shanxi 030600,China;School of Computer and Information Technology(School of Big Data),Shanxi University,Taiyuan Shanxi 030006,China)
机构地区:[1]晋中学院信息技术与工程学院,山西晋中030600 [2]山西大学计算机与信息技术学院(大数据学院),山西太原030006
基 金:带参照物的聚类集成方法研究(61773247)。
年 份:2021
卷 号:38
期 号:2
起止页码:308-312
语 种:中文
收录情况:BDHX、BDHX2020、JST、ZGKJHX、核心刊
摘 要:为了提高高维混合属性数据挖掘效果,提出基于K-Means聚类算法的高维混合属性数据挖掘方法。通过分析数值型数据和分类型数据相似度,获取高维混合属性数据度量标准,将簇中心点设为簇里点的平均数值或质心,引入最大距离自动生成k值策略与坐标转换策略,优化聚类结果;依据欧几里得距离聚类剩余数据,根据最大间距对应的数据中心点坐标与半径,实现数据集聚类划分;通过判定聚类后数据噪音类别,计算各类别中类异常因子,经过降序排列,挖掘并标记异常数据。仿真结果表明,所提方法对高维混合属性数据具有理想的聚类优势与较好的挖掘稳定性。
关 键 词:聚类算法 高维混合属性 数据挖掘 相似度
分 类 号:TP311]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...