期刊文章详细信息
文献类型:期刊文章
Liu Jiaxing;Zhang Honglie;Liu Yanju;Liu Yanzhong(School of Computer Science and Control Engineering,Qiqihar University,Qiqihar Heilongjiang 161006,China)
机构地区:[1]齐齐哈尔大学计算机与控制工程学院,黑龙江齐齐哈尔161006
基 金:齐齐哈尔市科学技术计划项目(工业攻关)(GYGG-201913);黑龙江省教育厅基本业务专项理工面上项目(135209243)
年 份:2021
期 号:2
起止页码:39-41
语 种:中文
收录情况:BDHX、BDHX2020、CSSCI、CSSCI2021_2022、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊
摘 要:机器学习和数据挖掘已经应用于诸多领域。然而由于各种原因,真实数据集通常包含缺失值。为了提高填补缺失值的准确率,文章基于不完整数据的不同缺失率,在R平台上对7种插补方法进行评估。实验结果表明,缺失森林和马尔科夫链蒙特卡洛方法的平均绝对百分误和误分类比率优于其他填补方法。基于验证结果,提出了一种混合插补方法,即在计算数据集的缺失率之后,使用缺失森林估算缺失率小于等于5%的缺失值,然后使用马尔科夫链蒙特卡洛填补缺失率为5%到10%的缺失值。
关 键 词:不完整数据集 缺失率 缺失森林 多重插补
分 类 号:TP311.13] TP181[计算机类]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...