登录    注册    忘记密码

期刊文章详细信息

基于谱聚类的无监督特征选择算法  ( EI收录)  

Spectral Clustering Based Unsupervised Feature Selection Algorithms

  

文献类型:期刊文章

作  者:谢娟英[1] 丁丽娟[1,3] 王明钊[2]

XIE Juan-Ying;DING Li-Juan;WANG Ming-Zhao(School of Computer Science,Shaanxi Normal University,Xi’an 710062,China;College of life Sciences,Shaanxi Normal University,Xi’an 710062,China;College of Information Engineering,Engineering University of PAP,Xi’an 710086,China)

机构地区:[1]陕西师范大学计算机科学学院,陕西西安710062 [2]陕西师范大学生命科学学院,陕西西安710062 [3]武警工程大学信息工程学院,陕西西安710086

出  处:《软件学报》

基  金:国家自然科学基金(61673251);陕西省科技攻关重点项目(2018ZDXMSF-079);国家重点研发计划(2016YFC0901900);科技成果转化培育项目(GK201806013);中央高校基本科研业务费专项资金(GK201701006);研究生培养创新基金(2015CXS028,2016CSY009,2018TS078)。

年  份:2020

卷  号:31

期  号:4

起止页码:1009-1024

语  种:中文

收录情况:AJ、BDHX、BDHX2017、CSA、CSA-PROQEUST、CSCD、CSCD2019_2020、EI、IC、INSPEC、JST、MR、RCCSE、SCOPUS、ZGKJHX、ZMATH、核心刊

摘  要:基因表达数据具有高维小样本特点,包含了大量与疾病无关的基因,对该类数据进行分析的首要步骤是特征选择.常见的特征选择方法需要有类标的数据,但样本类标获取往往比较困难.针对基因表达数据的特征选择问题,提出基于谱聚类的无监督特征选择思想FSSC(feature selection by spectral clustering).FSSC对所有特征进行谱聚类,将相似性较高的特征聚成一类,定义特征的区分度与特征独立性,以二者之积度量特征重要性,从各特征簇选取代表性特征,构造特征子集.根据使用的不同谱聚类算法,得到FSSC-SD(FSSC based on standard deviation) FSSCMD(FSSC based on mean distance)和FSSC-ST(FSSC based on self-tuning)这3种无监督特征选择算法.以SVMs(support vector machines)和KNN(K-nearest neighbours)为分类器,在10个基因表达数据集上进行实验测试.结果表明,FSSC-SD、FSSC-MD和FSSC-ST算法均能选择到具有强分类能力的特征子集.

关 键 词:谱聚类 无监督特征选择  特征独立性  特征区分度  特征重要度  

分 类 号:TP181]

参考文献:

正在载入数据...

二级参考文献:

正在载入数据...

耦合文献:

正在载入数据...

引证文献:

正在载入数据...

二级引证文献:

正在载入数据...

同被引文献:

正在载入数据...

版权所有©重庆科技学院 重庆维普资讯有限公司 渝B2-20050021-7
 渝公网安备 50019002500408号 违法和不良信息举报中心