VapSR
创始人
2024-01-16 18:43:22
0

1024刚过还得搬砖

注意机制在设计高级超分辨率(SR)网络中起着关键作用。在这项工作中,作者们通过改进注意机制设计了一个高效的SR网络。VapSR以更少的参数优于当前的轻量级网络。董超团队开源超大感受野注意力超分方案

paper:https://arxiv.org/abs/2210.05960

code:https://github.com/zhoumumu/VapSR

注意力机制是深度学习领域非常重要的一个研究方向,在图像超分领域也有不少典型的应用案例,比如基于通道注意力构建的RCAN,基于二阶注意力机制构建的SAN,基于像素注意力机制构建的PAN,基于Transformer自注意力机制构建的SwinIR,基于多尺度大核注意力的MAN等。

 本文以PAN为蓝本,对其进行逐步改进以期达到更少的参数量、更高的超分性能。该方案具体包含以下几个关键点:

  • 提升注意力分割的感受野,类似大核卷积注意力VAN;

  • 将稠密卷积核替换为深度分离卷积,进一步降低参数量;

  • 引入像素规范化(Pixel Normalization)技术,其实就是Layer Normalization,但出发点不同。

上述关键技术点为注意力机制的设计提供了一个清晰的演变路线,最终得到了本文的VapSR,即大感受像素注意力网络(VAst-receptive-field Pixel attention Network)。

实验结果表明:相比其他轻量超分网络,VapSR具有更少的参数量。比如,项目IMDB与RFDN,VapSR仅需21.68%、28.18%的参数即可取得与之相当的性能。

本文动机

通过引入像素注意力,PAN在大幅降低参数量的同时取得了非常优秀的性能。相比通道注意力与空域注意力,像素注意力是一种更广义的注意力形式,为进一步的探索提供了一个非常好的基线。

受启发于自注意力的发展,我们认为:基于卷积操作的注意力仍有进一步改进的空间。因此,作者通过以下三个像素注意力中的设计原则展示了改善超分注意力的过程:

  • 首先,在注意力分支引入大核卷积具有明显的优势;

  • 其次,深度分离卷积可以降低大核卷积导致的巨大计算复杂度问题;

  • 最后,引入像素规范化操作让训练更高效、更稳定。

Large Kernel 以上图i中的baseline为基础,作者首先对注意力分支进行感受野扩增:将提升到(将图示ii),性能提升0.15dB,但参数量从846K提升到了4123K。

Parameter Reduction 为降低参数量,我们尝试尽可能移除相对不重要的部分。作者提出了三个方案:(1) 将非注意力分支的卷积尺寸从下调到;(2) 将大核卷积注意力分支替换为深度深度分离卷积;(3) 将深度分离卷积中的深度卷积进行分解为深度卷积+带扩张因子的深度卷积(该机制可参考下图,将卷积拆分为+,其中后者的扩张因子为3)。此时,模型性能变为28.48dB,但参数量降到了240K,参数量基本被压缩到了极限。

 

Pixel Normalization(PN) 注意力机制的元素乘操作会导致训练不稳定问题:小学习率收敛不够好,大学习率又会出现梯度异常。前面的注意力改进导致所得方案存在性能下降问题。为解决该问题,作者经深入分析后提出了像素规范化技术(可参考下图不同规范化技术的可视化对比)。 

本文方案

前面的探索主要聚焦在微观层面,基于此,作者进一步在宏观层面进行了更多设计与提炼,进而构建了VapSR,取得了更佳的性能,同时具有更少的参数量。

 

class Attention(nn.Module):  def __init__(self, dim):  super().__init__()  self.pointwise = nn.Conv2d(dim, dim, 1)  self.depthwise = nn.Conv2d(dim, dim, 5, padding=2, groups=dim)  self.depthwise_dilated = nn.Conv2d(dim, dim, 5, 1, padding=6, groups=dim, dilation=3)  def forward(self, x):  u = x.clone()  attn = self.pointwise(x)  attn = self.depthwise(attn)  attn = self.depthwise_dilated(attn)  return u * attn  class VAB(nn.Module):  def __init__(self, d_model, d_atten):  super().__init__()  self.proj_1 = nn.Conv2d(d_model, d_atten, 1)  self.activation = nn.GELU()  self.atten_branch = Attention(d_atten)  self.proj_2 = nn.Conv2d(d_atten, d_model, 1)  self.pixel_norm = nn.LayerNorm(d_model)  default_init_weights([self.pixel_norm], 0.1)  def forward(self, x):  shorcut = x.clone()  x = self.proj_1(x)  x = self.activation(x)  x = self.atten_branch(x)  x = self.proj_2(x)  x = x + shorcut  x = x.permute(0, 2, 3, 1) #(B, H, W, C)  x = self.pixel_norm(x)  x = x.permute(0, 3, 1, 2).contiguous() #(B, C, H, W)  return x  

本文实验 

在实验部分,作者构建了VapSR与VapSR-S两个版本的轻量型超分方案:

  • VapSR:包含21个VAB模块,主干通道数为48;

  • VapSR-S:包含11个VAB模块,主干通道数为32。

此外,需要注意的是:对于X4模型,重建模块并未采用常规的轻量方案(Conv+PS),而是采用了类EDSR的重方案(Conv+PS+Conv+PS)。

    whaosoft aiot http://143ai.com 

 上表&图给出了不同方案的性能与可视化效果对比,从中可以看到:

  • 所提VapSR取得了SOTA性能,同时具有非常少的参数量。

  • 在X4任务上,相比RFDN与IMDN,VapSR仅需21.68%/28.18%的参数量,即可取得平均0.187dB指标提升;

  • VapSR-S取得了与BSRN-S相当的性能,后者是NTIRE2022-ESR模型复杂度赛道冠军。

  • 在线条重建方面,VapSR具有比其他方案更精确的重建效果。

 

相关内容

热门资讯

《站立式起跑》说课稿 小学四年级体育《站立式起跑》说课稿(精选3篇)  作为一名无私奉献的老师,常常需要准备说课稿,借助说...
重庆小山峡导游词 重庆小山峡导游词  巫山小小三峡是位于大宁河滴翠峡处的支流马渡河上,是长滩峡、秦王峡、三撑峡的总称;...
高中新学期国旗下讲话稿 高中新学期国旗下讲话稿范文(精选6篇)  在充满活力,日益开放的今天,用到讲话稿的地方越来越多,讲话...
小学一年级数学下册《认识时间... 人教版小学一年级数学下册《认识时间》说课稿  一、教材分析  1、教学内容:人教版义务教育课程标准实...
优秀的保国寺导游词 优秀的保国寺导游词  保国寺是我国江南保存最完好的北宋木结构建筑,是国务院公布的第一批全国重点文保单...
广东省厦门植物园导游讲解词 广东省厦门植物园导游讲解词  现在我们来到西大门也就是植物园的主入口,建园后的多次重建,现大门建于1...
英文导游欢迎词 英文导游欢迎词范文  下面是关于英文的导游欢迎词范文,希望对大家有帮助!  英文导游欢迎词范文一  ...
乔家大院的导游词 乔家大院的导游词  导游词是导游人员引导游客观光游览时讲解词,是导游员同游客交流思想,向游客传播文化...
绍兴鉴湖导游词-浙江导游词 绍兴鉴湖导游词-浙江导游词  作为一名专门引导游客、助人为乐的导游,通常需要用到导游词来辅助讲解,导...
长白山天池奇峰导游词 长白山天池奇峰导游词范文  游客朋友们,下面我向大家介绍雄峙长白山山巅,组成长白山宏大壮丽的雄姿,护...
导游词作文350字左右 篇一大家好!欢迎大家来到敦煌莫高窟,我是你们的张导游,请大家保护它的卫生,不要乱涂乱画,随时注意安全...
青岛花石楼导游词 青岛花石楼导游词  作为一名乐于助人的导游,就难以避免地要准备导游词,导游词不是以一代百、千篇一律的...
兰州白塔山导游词 兰州白塔山导游词范文  作为一名尽职尽责的导游,时常会需要准备好导游词,导游词具有极强的实用性,涉及...
惠州中山公园导游词 惠州中山公园导游词范文  作为一位无私奉献的导游,通常会被要求编写导游词,导游词是导游员在游览时为口...
介绍重庆山水之都导游词 介绍重庆山水之都导游词  作为一名专门为游客提供优质服务的导游人员,时常需要编写导游词,导游词是导游...
抚顺海洋馆导游词_导游词 抚顺海洋馆导游词_导游词  作为一名默默奉献的导游,总不可避免地需要编写导游词,导游词具有极强的实用...
善卷洞的导游词 善卷洞的导游词  善卷洞位于螺岩山中,是一个古老的石灰岩溶洞,游程长约800米,全洞面积约5000平...
苏木山森林公园导游词 苏木山森林公园导游词  作为一名可信赖的导游人员,总不可避免地需要编写导游词,导游词具有形象、生动、...
小学四年级导游词 小学四年级导游词  作为一名优秀的旅游从业人员,可能需要进行导游词编写工作,导游词具有极强的实用性,...
河南信阳南湾湖景区导游词 河南信阳南湾湖景区导游词  我们今天将要游览的是信阳南湾湖风景区。南湾湖风景区位于信阳市西南郊外,距...