登录    注册    忘记密码

期刊文章详细信息

基于学生化极差分布的随机森林变量选择研究    

Variable Selection in Randon Forests Based on Studentized Range Distribution

  

文献类型:期刊文章

作  者:曹桃云[1] 陈敏琼[2]

CAO Tao-yun;CHEN Min-qiong(School of Statistics and Mathematics,Guangdong University of Finance and Economics,Guangzhou 510320,China;School of Economics and Trade,Xinhua College of Sun Yat-Sen University(Dongguan),Guangzhou 510520,China)

机构地区:[1]广东财经大学统计与数学学院,广东广州510320 [2]中山大学新华学院经济与贸易学院,广东广州510520

出  处:《统计与信息论坛》

基  金:广东省自然科学基金面上项目“机器学习方法在纵向数据分析中的稳健性研究”(2020A1515011580);广东财经大学校级学位与研究生教育改革研究项目“科教融合视角下研究生培养模式探索与实践”(2021YB08)。

年  份:2021

卷  号:36

期  号:8

起止页码:15-22

语  种:中文

收录情况:BDHX、BDHX2020、CSSCI、CSSCI2021_2022、NSSD、RCCSE、RWSKHX、ZGKJHX、核心刊

摘  要:变量选择一直是统计分析与推断中的重要研究内容。针对该研究内容,提出一种基于随机森林的变量选择新方法。以随机森林中的最小深度重要性度量和置换重要性度量为基础,对得到的变量最小深度重要性得分和置换重要性得分,引入学生化极差分布进行变量重要性得分差异是否显著的检验。根据检验的结果将变量分组,对分组变量采用逐步回归方法挑选。运用新方法在模拟设计的线性模型、二次函数模型和复杂模型上,都能够选出真正变量,验证了新方法的有效性和可行性。经典的波士顿房价数据上的运用分析给出了新方法的实用性。

关 键 词:学生化极差分布  随机森林  变量选择  最小深度重要性  置换重要性  

分 类 号:O212]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心