期刊文章详细信息
基于MIP和改进模糊K-Means算法的大数据聚类设计
Design for Large Data Clustering Based on MIP and Improved Fuzzy K-Means Algorithm
文献类型:期刊文章
机构地区:[1]广东海洋大学网络与教育技术中心,广东湛江524088
年 份:2014
卷 号:22
期 号:4
起止页码:1270-1272
语 种:中文
收录情况:BDHX、BDHX2011、CSA、CSA-PROQEUST、INSPEC、ZGKJHX、核心刊
摘 要:为了克服经典模糊K-Means算法在面对大数据聚类时所出现的聚类效率低和运行时间长的问题,提出了一种基于层次式MPI并行编程模型和改进模糊K-Means算法的大数据聚类方法;首先,引入多层MasterNode节点设计了一种改进的层次式MPI并行编程模型,然后,引入类间距离和类内距离得到一种最优聚类数的计算方式,并设计了一种改进的模糊K-均值聚类算法;采用SlaveNode节点并行运行改进的模糊K均值算法进行数据子集聚类,然后再通过各层MasterNode节点进行汇总和进一步处理;仿真实验表明文中方法能较为精确地实现大数据聚类,准确精确度较经典模糊K均值算法平均约高5.6%,弥补了经典模糊K-Means方法在处理大数据时的正确率低和低效的缺点,具有很强的优越性。
关 键 词:模糊K均值 聚类 大数据 距离
分 类 号:TP393]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...