期刊文章详细信息
并行化的Apriori算法在海量医疗文档数据挖掘中的应用及优化
Optimization and application of Apriori algorithm based on MapReduce in medical big data
文献类型:期刊文章
机构地区:[1]国防科技大学计算机学院,湖南长沙410073 [2]国家超级计算天津中心大数据处理技术与应用国家地方联合实验室,天津300457 [3]天津医科大学附属肿瘤医院肺部肿瘤科,天津300070
基 金:国家发改委高技术服务业基金资助项目(2014648)
年 份:2016
卷 号:52
期 号:4
起止页码:420-424
语 种:中文
收录情况:AJ、BDHX、BDHX2014、CAS、CSCD、CSCD2015_2016、INSPEC、JST、MR、RCCSE、WOS、ZGKJHX、ZMATH、ZR、核心刊
摘 要:针对海量医疗文档数据中巨大潜在价值难以有效挖掘的现状,构建了基于NoSQL和MapReduce的存储与挖掘系统MSPM.通过以键值对形式存储,使复杂异构的医疗文档数据归结为统一的且适于被经典Apriori算法利用的事务数据格式,并通过挖掘MapReduce过程化,一次性全局扫描和兴趣集规约计数等优化策略,有效解决了Apriori算法在医疗大数据应用中开销大、执行速度慢和有效性差的问题.
关 键 词:医疗文档大数据 非关系型数据库 MAPREDUCE 数据挖掘 APRIORI 算法优化
分 类 号:TP301.6]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...