15、CF-ViT: A General Coarse-to-Fine Method for Vision Transformer
创始人
2024-06-02 13:50:33
0

简介

论文:https://arxiv.org/abs/2203.03821
github:https://arxiv.org/pdf/2203.03821.pdf

transformer 输入图像的空间维度上产生了相当大的冗余,导致大量的计算成本。

论文提出一种粗到细的vision transformer(CF-ViT)来减轻计算负担,同时保持性能

CF-ViT在不影响性能的情况下,比LV-ViT降低了53%的FLOPs,吞吐量也达到了2.01×
在这里插入图片描述
vit transformer 加速方法

  • Static ViT Compression
    致力于通过手动设计模块,无论输入图像如何,都具有固定的计算图,从而降低网络复杂性
  • Dynamic ViT Compression
    动态ViT根据其输入图像调整计算图

vis transformer公式

编码、输入
在这里插入图片描述
注意力权重
在这里插入图片描述
FFN
在这里插入图片描述

实现流程

主要思想是减少输入序列长度来降低计算成本
在这里插入图片描述
理论依据是

  • 粗粒度的补丁分割也可以很好地定位信息对象
  • 大多数图像在较短的序列长度内都能被ViT模型很好地识别

论文方法将vis transformer的过程分为两阶段实现

在粗推理阶段使用较小长度的标记序列实现图像识别,如果预测结果没达到阈值,进一步分割信息区域以进行细粒度识别

Coarse Inference Stage

输入
在这里插入图片描述
假设有 k 个编码器,输出为
在这里插入图片描述
再经过一个分类器 F,得到各个patch的 n-分类结果
在这里插入图片描述
取最大的分类概率值
在这里插入图片描述
使用阈值 η 来实现性能和计算之间的权衡,如果 pjc>ηp^c_j > ηpjc​>η,那么输出分类结果为 j 类,否则进入细推理阶段

Informative Region Identification

并不是对所有patch都进行细分,识别并重新划分这些对性能提高最有利的信息 patch
在这里插入图片描述

使用类注意力 ak0a^0_kak0​ 作为分数来指示一个令牌是否具有信息

全局类注意力:此外,使用指数移动平均(EMA)将不同编码器之间的类注意结合起来,以更好地识别信息补丁
在这里插入图片描述
β=0.99\beta = 0.99β=0.99 全局类注意力从第 4 个编码器开始,在最后一个编码器αˉK\bar{\alpha}_KαˉK​ 中选取全局类注意力得分较高的patch

Fine Inference Stage

通过注意力权重大小对patch进行排序后,进一步限制细推理的patch数量

限定细粒度分裂后的patch数为
在这里插入图片描述
α∈[0,1]\alpha \in [0,1]α∈[0,1]提供了准确性和效率之间的权衡

α = 0表示没有很好的推断,结果 patch 最少,虽然计算上很经济,但如果测试集充满了“硬”图像,性能就会下降

α = 1导致CF-ViT精细推理阶段退化到传统的ViT模型

α设为0.5

Feature Reuse

在这里插入图片描述
经过patch限定后的输入patch为:
在这里插入图片描述
为了不丢失原有的信息,将划分前的patch信息注入到四个细粒度补丁中

如上上图所示,x~0f\tilde{x}_0^fx~0f​首先经过一个MLP映射,然后复制4份,再根据粗推理阶段的预测结果进行筛选,得到Xr=FR(xK1;xL2;⋯;xKNc)X_r = FR(x^1_K;x^2_L;\cdots;x_K^{N_c})Xr​=FR(xK1​;xL2​;⋯;xKNc​​),然后分别与细粒度划分后的patch相加

在这里插入图片描述
简单而言,就是每个划分后的小patch应该继承划分前大patch的信息

划分后再经过一个分类器得到预测分类结果 pfp^fpf
在这里插入图片描述

实验

损失函数
在这里插入图片描述
交叉熵损失 和 Kullback-Leibler散度

使用的η = 1,这意味着对每个输入图像都会执行精细推断阶段,η值越大,进入精细推理阶段的输入越多,性能越好,但计算成本也越大,反之亦然

result

在这里插入图片描述
在这里插入图片描述

上一篇:连接池介绍

下一篇:shell重定向

相关内容

热门资讯

开学第一天作文四年级300字... 篇一:开学第一天作文四年级300字16篇第一篇内容:开学第一天的新鲜感今天是开学的第一天,我早早地起...
我的妈妈四年级作文(实用6篇... 我的妈妈四年级作文 篇一:我的妈妈是最好的妈妈我的妈妈是一位非常了不起的妈妈。她是我的榜样和朋友。她...
金仓湖四年级作文(最新6篇) 金仓湖四年级作文 篇一秋天的金仓湖金仓湖是我家附近的一个美丽湖泊,它四季如春,我最喜欢的季节是秋天。...
我喜欢春天四年级优秀作文【最... 我喜欢春天四年级优秀作文 篇一春天是一年中最美丽的季节,我非常喜欢春天。春天来了,大地变得生机勃勃,...
四年级300字350字作文(... 四年级300字作文 篇一: 我最喜欢的动物我最喜欢的动物是熊猫。熊猫是中国的国宝,它们有着黑白相间的...
我自己作文600字(精选4篇... 我自己作文600字 篇一我的追梦之路人生如同一场漫长的旅行,每个人都带着自己的梦想踏上这个旅程。而我...
我心中的秘密作文四年级300... 我心中的秘密作文四年级300字63篇 篇一标题:小猫咪的秘密我家养了一只小猫咪,它是我心中的秘密。它...
捉螃蟹六年级作文(经典3篇) 捉螃蟹六年级作文 篇一:难忘的螃蟹之旅今年夏天,我和家人一起去了一个美丽的海边小镇度假。除了游泳、沙...
好样的,家乡菜四年级作文(实... 好样的,家乡菜四年级作文 篇一家乡菜是我最喜欢的美食之一。它不仅味道鲜美,而且富含各种营养成分。我想...
四年级期末作文【经典5篇】 四年级期末作文 篇一:我的暑假计划暑假就要到了,我已经迫不及待地想要开始我的暑假计划了。这个暑假,我...
温暖的时刻作文600字六年级... 温暖的时刻作文600字六年级 篇一温暖的时刻今天是一个特别温暖的日子,阳光明媚,微风轻拂,仿佛整个世...
多彩的活动六年级作文600字... 多彩的活动六年级作文600字 篇一喜迎运动会今天是我们学校年度盛事——运动会的日子,同学们都早早地来...
我想象中的六年级作文【实用3... 我想象中的六年级作文 篇一我的六年级生活六年级,对于我来说是一个充满期待和憧憬的年级。我想象中的六年...
珍惜资源六年级作文(精彩6篇... 珍惜资源六年级作文 篇一珍惜资源,从我做起我国资源状况非常严峻,各种资源的浪费现象屡见不鲜。作为一个...
我最害怕的事六年级作文【通用... 我最害怕的事六年级作文 篇一我的最大恐惧我叫小明,是一个六年级的学生。尽管我还小,但也有着自己最害怕...
小学六年级英语作文:The ... 小学六年级英语作文: The benefits of reading 篇一Reading is an...
小学六年级语文上册句子练习(... 小学六年级语文上册句子练习 篇一我最喜欢的动物我最喜欢的动物是猫。猫有着柔软的皮毛和敏捷的身手,总是...
宽容六年级作文(精简6篇) 宽容六年级作文 篇一:宽容的力量宽容是一种美德,它可以让人与人之间更加和谐,让世界变得更加美好。作为...
如何保护环境作文(实用3篇) 如何保护环境作文 篇一保护环境是我们每个人的责任。环境污染已经给我们的生活带来了很多问题,因此保护环...
我心目中的英雄六年级作文【通... 我心目中的英雄六年级作文 篇一我心目中的英雄英雄,对于每个人来说,可能有着不同的定义。但对我来说,我...