期刊文章详细信息

基于ViT的细粒度图像分类
Fine-grained visual classification based on vision transformer

文献类型：期刊文章

作　　者：李佳盈[1] 蒋文婷[2] 杨林[3] 罗铁坚[4]

LI Jia-ying;JIANG Wen-ting;YANG Lin;LUO Tie-jian(School of Automation,Beijing Information Science and Technology University,Beijing 100854,China;Institute of Telecommunication and Navigation Satellites,China Academy of Space Technology,Beijing 100091,China;Institute 706,Second Academy of China Aerospace Science and Industry Corporation,Beijing 100039,China;School of Computer Science and Technology,University of Chinese Academy of Sciences,Beijing 100854,China)

机构地区：[1]北京信息科技大学自动化学院,北京100854 [2]中国空间技术研究院通信与导航卫星总体部,北京100091 [3]中国航天科工集团第二研究院七〇六所,北京100039 [4]中国科学院大学计算机科学与技术学院,北京100854

出　　处：《计算机工程与设计》

年　　份：2023

卷　　号：44

期　　号：3

起止页码：916-921

语　　种：中文

收录情况：BDHX、BDHX2020、IC、JST、RCCSE、ZGKJHX、核心刊

摘　　要：为解决细粒度图像分类任务存在类内差异性和类间相似性大的问题,提出一种基于Vision Transformer(ViT)的细粒度图像分类方法。采取ViT作为特征编码网络,获取图像的全局特征表示;设计多级区域选择模块,捕捉细微的具有可判别性的层级化信息;利用一个简单且有效的中心损失函数,缩短深层特征与相应类中心在特征空间中的距离。在图像级标签的监督下,实现端到端的训练。结果在CUB-200-2011、NABirds以及Stanford Cars数据集上分别达到90.1%、90.2%和93.7%的分类准确率,超越当前最优算法。

关键词：细粒度图像分类深度自注意力变换网络注意力机制中心损失卷积神经网络特征表示特征空间

分类号：TP391]

参考文献：

正在载入数据...

二级参考文献：

正在载入数据...

耦合文献：

正在载入数据...

引证文献：

正在载入数据...

二级引证文献：

正在载入数据...

同被引文献：

正在载入数据...

重庆科技学院机构知识库

期刊文章详细信息

基于ViT的细粒度图像分类
Fine-grained visual classification based on vision transformer

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

重庆科技学院机构知识库

期刊文章详细信息

基于ViT的细粒度图像分类 Fine-grained visual classification based on vision transformer

我的收藏

参考文献：

二级参考文献：

耦合文献：

引证文献：

二级引证文献：

同被引文献：

基于ViT的细粒度图像分类
Fine-grained visual classification based on vision transformer