期刊文章详细信息
文献类型:期刊文章
机构地区:[1]上海交通大学医学院生物医学工程系,上海200025
基 金:上海市教委科研(04BB11)
年 份:2009
卷 号:28
期 号:2
起止页码:221-225
语 种:中文
收录情况:BDHX、BDHX2008、CAS、CSCD、CSCD2011_2012、EMBASE、IC、INSPEC、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:本研究对SEER乳腺癌登记资料库中的数据进行预处理,以5年生存率为指标,建立基于神经网络的乳腺癌生存预测模型。经预处理后的数据类别分布呈现明显的不平衡状态,这种不平衡会严重影响模型的性能。采用过抽样、欠抽样技术来弥补数据类别分布不平衡对模型性能的不利影响。通过比较不同的抽样比例,采用ROC曲线下面积(AUC)、正确度、特异度、灵敏度评估模型。经过10折分层交叉验证,当抽样比例为650%,AUC达到最大值0.761 3,特异度为0.741 5,灵敏度为0.781 1,正确度为0.775 8。
关 键 词:神经网络 乳腺癌 抽样技术 数据挖掘
分 类 号:TP391]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...