期刊文章详细信息
文献类型:期刊文章
XIE Juan-Ying;DING Li-Juan;WANG Ming-Zhao(School of Computer Science,Shaanxi Normal University,Xi’an 710062,China;College of life Sciences,Shaanxi Normal University,Xi’an 710062,China;College of Information Engineering,Engineering University of PAP,Xi’an 710086,China)
机构地区:[1]陕西师范大学计算机科学学院,陕西西安710062 [2]陕西师范大学生命科学学院,陕西西安710062 [3]武警工程大学信息工程学院,陕西西安710086
基 金:国家自然科学基金(61673251);陕西省科技攻关重点项目(2018ZDXMSF-079);国家重点研发计划(2016YFC0901900);科技成果转化培育项目(GK201806013);中央高校基本科研业务费专项资金(GK201701006);研究生培养创新基金(2015CXS028,2016CSY009,2018TS078)。
年 份:2020
卷 号:31
期 号:4
起止页码:1009-1024
语 种:中文
收录情况:AJ、BDHX、BDHX2017、CSA、CSA-PROQEUST、CSCD、CSCD2019_2020、EI、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊
摘 要:基因表达数据具有高维小样本特点,包含了大量与疾病无关的基因,对该类数据进行分析的首要步骤是特征选择.常见的特征选择方法需要有类标的数据,但样本类标获取往往比较困难.针对基因表达数据的特征选择问题,提出基于谱聚类的无监督特征选择思想FSSC(feature selection by spectral clustering).FSSC对所有特征进行谱聚类,将相似性较高的特征聚成一类,定义特征的区分度与特征独立性,以二者之积度量特征重要性,从各特征簇选取代表性特征,构造特征子集.根据使用的不同谱聚类算法,得到FSSC-SD(FSSC based on standard deviation) FSSCMD(FSSC based on mean distance)和FSSC-ST(FSSC based on self-tuning)这3种无监督特征选择算法.以SVMs(support vector machines)和KNN(K-nearest neighbours)为分类器,在10个基因表达数据集上进行实验测试.结果表明,FSSC-SD、FSSC-MD和FSSC-ST算法均能选择到具有强分类能力的特征子集.
关 键 词:谱聚类 无监督特征选择 特征独立性 特征区分度 特征重要度
分 类 号:TP181]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...