期刊文章详细信息
文献类型:期刊文章
SUN Yu-Chen;XU Qian-Qian;WANG Zi-Tai;YANG Zhi-Yong;HUANG Qing-Ming(Key Laboratory of Intelligent Information Processing,Institute of Computing Technology,Chinese Academy of Sciences,Beijing 100190;School of Computer Science and Technology,University of Chinese Academy of Sciences,Beijing 101408;State Key Laboratory of Information Security,Institute of Information Engineering,Chinese Academy of Sciences,Beijing 100093;School of Cyber Security,University of Chinese Academy of Sciences,Beijing 100049;Key Laboratory of Big Data Mining and Knowledge Management,University of Chinese Academy of Sciences,Beijing 101408;Peng Cheng Laboratory,Shenzhen,Gruangdong 518055)
机构地区:[1]中国科学院计算技术研究所智能信息处理重点实验室,北京100190 [2]中国科学院大学计算机科学与技术学院,北京101408 [3]中国科学院信息工程研究所信息安全国家重点实验室,北京100093 [4]中国科学院大学网络空间安全学院,北京100049 [5]中国科学院大学大数据挖掘与知识管理重点实验室,北京101408 [6]鹏城实验室,广东深圳518055
基 金:科技创新2030-“新一代人工智能”重大项目(2018AAA0102000);国家自然科学基金项目(62236008,U21B2038,U23B2051,61931008,62122075,61976202);中央高校基本科研业务费专项基金;中国科学院青年促进会会员项目;中国科学院战略性先导科技专项(XDB0680000);中国科学院计算技术研究所创新基金(E000000)资助。
年 份:2024
卷 号:47
期 号:11
起止页码:2678-2690
语 种:中文
收录情况:BDHX、BDHX2023、CAS、CSCD、CSCD2023_2024、EAPJ、EI、JST、RCCSE、SCOPUS、ZGKJHX、核心刊
摘 要:多任务学习是一种基于相似任务之间的关联性进行学习迁移,使得模型在数据不足场景下仍能表现出良好泛化性能的学习方法.在该领域内,大多数现有以准确率作为基准评价标准的方法只适用于平衡分布场景.然而,诸多实际应用如疾病检测、垃圾邮件检测等,均涉及样本分布不平衡问题.针对多任务学习面向任务相关性的高要求,即当模型学习和共享不相关知识时,负迁移可能会影响模型朝着错误方向训练.因此,大多数现有方法在此类场景中无法得到有效应用.为解决该实际问题,设计一种能适用于样本不平衡场景的多任务学习算法变得尤为重要.本文提出了一种基于自适应低秩表示的多任务AUC优化算法,首先引入了对标签分布不敏感的ROC曲线下面积(AUC)作为该学习任务的评价指标,并建立了一种用于AUC优化的多任务学习算法,以提高模型在样本不平衡场景下的性能表现.同时,为进一步有效优化模型,本文将原始成对优化问题重构为逐样本极大极小优化问题,使得每一轮迭代复杂度由O(Ln_(i,+)n_(i,-))降低至O(L(n_(i,+)+n_(i,-))).针对多任务学习中存在的负迁移现象,本文引入了一种自适应低秩正则项,以消除模型冗余信息,同时提高模型的泛化性能.最后,通过与多个对比方法在四个仿真数据集和三个真实数据集Landmine、MHC-I和USPS上的比较,所有实验结果一致证明了本文所提出算法的有效性.
关 键 词:多任务学习 AUC优化 低秩表示
分 类 号:TP18]
参考文献:
正在载入数据...
二级参考文献:
正在载入数据...
耦合文献:
正在载入数据...
引证文献:
正在载入数据...
二级引证文献:
正在载入数据...
同被引文献:
正在载入数据...

