专利详细信息
文献类型:专利
专利类型:发明专利
是否失效:否
是否授权:否
申 请 号:CN201710862873.7
申 请 日:20170921
申 请 人:深圳金融电子结算中心有限公司
申请人地址:518000 广东省深圳市福田区车公庙泰然六路501栋
公 开 日:20180306
公 开 号:CN107766442A
代 理 人:胡海国
代理机构:44287 深圳市世纪恒程知识产权代理事务所
语 种:中文
摘 要:本发明公开了一种海量数据关联规则挖掘方法及系统,所述方法包括:主节点将事物数据集分割成多个目标数据集并分配给不同的从属节点,然后由从属节点对接收到的目标数据集进行基于关联规则的挖掘获得局部频繁项集,并对获得的局部频繁项集过滤;再由主节点将事务数据集以及过滤后的局部频繁项集分配给从属节点进行频繁项计算,从而能够在事物数据集较为庞大的时候,仍然能较为快速计算出目标频繁项集,提高了计算效率。
主 权 项:1.一种海量数据关联规则挖掘方法,其特征在于,所述方法包括:主节点获取事务数据集,将所述事务数据集分割为多个目标数据集;从属节点接收所述主节点发送的目标数据集,并根据关联规则算法对接收到的目标数据集进行挖掘,获得所述目标数据集对应的局部频繁项集;所述从属节点根据所述目标数据集对应的局部最小支持度计数,对所述局部频繁项集进行过滤,获得过滤后的局部频繁项集;所述从属节点获取所述事务数据集,并根据所述事务数据集的全局最小支持度对过滤后的局部频繁项集进行筛选,获得全局频繁项集;所述从属节点根据所述全局最小支持度计数对所述全局频繁项集进行过滤,获得目标频繁项集。
关 键 词:频繁项集 从属节点 数据集 主节点 过滤 关联规则挖掘 多个目标 关联规则 海量数据 计算效率 快速计算 目标数据 事务数据 事物 分配 挖掘 分割
IPC专利分类号:G06F17/30(20060101)
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...