Rethinking Channel Dimensions for Efficient Model Design论文笔记
创始人
2025-06-01 09:16:48
0

Rethinking Channel Dimensions for Efficient Model Design, 2021,CVPR

本文先对常见的卷积层的通道比例进行实验分析得到每一层的性能和通道比例以及非线性层的关系。

接着,暴力搜索整个网络结构(当然,如果直接暴力求解,计算量太大,这里作者做了不少限制,得到了层与层之间的通道比例)

结合两个部分得到的实验结果,便可以得到最终的模型结果。

在这里插入图片描述

一、背景介绍

1.词汇介绍

  • Stem: 这里我认为是指的网络第一层的卷积层
  • Params: 指的是模型训练中需要训练的参数总数,这里我们应该知道卷积网络中如果每一层的输出或输入通道数变多,相应的模型的参数总数也会变多。
  • FLOPs: 浮点数运算次数,理解为计算量,可以用来衡量算法的复杂度。一个乘法或一个加法都是一个FLOPs
  • FLOPS:(注意:这里的S是大写)每秒浮点运算次数,理解为计算速度,是一个衡量硬件性能的指标。
  • Expansion Ratio: 指的是输出通道数比上输入通道数。
  • Inverted resiudal block: 这是MobileNetV2网络提出的一个结构。网络结构如下:

img

这个和常见的残差模块不同地方在于中间层的通道数大于两侧的通道数,即中间宽两边窄。而常见的残差模块是中间窄两边宽。此外,该结构主要用来用于减小模型参数量,故卷积使用了深度可分离卷积。

另外,作者提出该网络时的切入点认为常见的做法时卷积层后面添加ReLU层,可以用来提高模型泛化性能。但是如果卷积层的输出通道数太小,会导致模型输出特征缺少。故对于浅层网络,应该避免使用ReLU层。

2.通道设置常见做法

轻量化模型为了节约计算资源,大部分都采用先在浅层网络使用较小的维度,在最后几层突然增大特征维度。下图中的右图随着网络层数变深,图线斜率逐渐变大。

在这里插入图片描述

从上图我们不难发现,当选取的通道数不一样即使模型参数总量变小,Flops变小,模型性能也可能上升(上图标红)。故设计一个更为合理的通道配置是很有必要的。

二、理论基础

1.单层网络设计基础

网络可以通过改造单层来提升网络整体性能。

这里作者提出可以利用网络得到的output feature的秩来评估网络层,秩越大,网络层性能越好,而且通过非线性层后秩可以提高。但这个具体操作也没有具体明说,比如秩是如何计算得到的,毕竟特征有三个维度。故不好解释。下面主要放一下实验配置和实验结果。

在这里插入图片描述

在这里插入图片描述

从上图我们可以得到以下结论:

1.急剧增加的通道扩张比率会伤害网络层的性能。

2.非线性层可以提高网络性能。

3.非线性层对于卷积层而言是比较重要的。

作者为了验证上述发现,利用上述结论改造了模型,最终发现Baseline性能得到了提高。

在这里插入图片描述

2.网络整体通道配置设置

在这里插入图片描述

作者首先建立一个简单的数学模型,接着做了一系列的简化用来缩小搜索范围。

To control the other variables, we set all the networks that have the fixed channel dimension at the stem 3×3 convolution of 16 followed by a BN with a ReLU and have the large expansion layer at the penultimate layer. We use the original inverted bottleneck (expansion ratio of 6) as our building blocks, which is a fundamental block of lightweight NAS methods, so we do not search the building blocks’ expansion ratio. The chosen elements are based on the above investigation of single-layer design. Optimization is done alternatively by searching and training a network. We train each model for 30 epochs for faster training and the early stopping strategy . Each training is repeated three times for averaging the accuracies to reduce the accuracy fluctuation caused by random initialization.

可以看出,作者为了进行搜索查找还特地进行了30个epoch的训练。

实验结果如下:

在这里插入图片描述

在这里插入图片描述

从上图可以看出网络整体的通道配置应该和层数索引呈线性关系

3.最终模型(ReXNet)

在这里插入图片描述

三、实验结果

这里,作者提出的模型性能嘎嘎棒,故实验结果不再详细介绍。

在这里插入图片描述

相关内容

热门资讯

《书怀》 《书怀》 刘幽求 唐代 刘幽求 心为明时尽,君门尚不容。田园迷径路,归去欲何从。 《书怀》刘...
《四时白纻歌 春白纻》 《四时白纻歌 春白纻》 沈约 南北朝 沈约 兰叶参差桃半红。飞芳舞縠戏春风。如娇如怨状不同。...
《长命女》 《长命女》 冯延巳 五代 冯延巳 春日宴,绿酒一杯歌一遍。再拜陈三愿:一愿郎君千岁,二愿妾身...
《寄程鹏飞》 《寄程鹏飞》 刘过 宋代 刘过 往事游边忆少年,未尝携刺五侯门。春风跃马汉南道,落日椎牛淮上...
《夜香》 《夜香》 陆游 宋代 陆游 投老误乘传,窃食惭无功。清夜一炷香,实与天心通。忤物虽至愚,许国...
《月上瓜洲·寓乌夜啼南徐多景... 《月上瓜洲·寓乌夜啼南徐多景楼作》 张辑 宋代 张辑 江头又见新秋。几多愁。塞草连天何处、是...
《竹枝词二首》 《竹枝词二首》 黄庭坚 宋代 黄庭坚 撑崖拄谷蝮蛇愁,入箐攀天猿掉头。鬼门关外莫言远,五十三...
《寄魏景山》 《寄魏景山》 方回 宋代 方回 长桥身作长城梦,南五湖天北济淮。重听吴歈怜我老,忆骑塞马与君...
《金釜山灵泉》 《金釜山灵泉》 吴宗旦 宋代 吴宗旦 泉来有脉去无痕,水底神龙暗吐吞。莫怪一池杯样小,个中风...
《林若愚七十》 《林若愚七十》 陈藻 宋代 陈藻 思我从网山,问道红泉市。托翁自渔溪,饷我百余里。数穷初值变...
《村晚》 《村晚》 张耒 宋代 张耒 深坞繁花丽,晴田细径分。孤舟春水路,芳草夕阳村。暗雀投檐静,昏鸦...
《合江亭》 《合江亭》 李恭 宋代 李恭 一丝风下碧云天,亭上窗开霁色鲜。严子钓台青树里,桐君丹灶白云边...
坎儿井组诗现代诗歌 坎儿井组诗现代诗歌  (一)  穿越千里  婉如玉带  你从那天际雪山起步  携历史的一路尘埃  涓...
《落第》 《落第》 孟郊 唐代 孟郊 晓月难为光,愁人难为肠。谁言春物荣,独见叶上霜。雕鹗失势病,鹪鹩...
《题卢州郡斋》 《题卢州郡斋》 郑綮 唐代 郑綮 九衢尘里一书生,多达逢时拥旆旌。醉里眼开金使字,紫旂风动耀...
《太白楼》 《太白楼》 文天祥 宋代 文天祥 高城蘸云根,聊可慰心迹。长风万里来,如对骑鲸客。监州好事者...
《陈九溪中草堂》 《陈九溪中草堂》 法振 唐代 法振 溪草落溅溅,鱼飞入稻田。早寒临洞月,轻素卷帘烟。dU帻题...
《菩萨蛮》 《菩萨蛮》 温庭筠 唐代 温庭筠 凤凰相对盘金缕,牡丹一夜经微雨。明镜照新妆,鬓经双脸长。画...
《香炉寺》 《香炉寺》 王洋 宋代 王洋 道边绕庙占疏凉,郊远山连草树荒。果有祖师传印在,为予试爇一炉香...
《石壕吏》 《石壕吏》  教学设想  理解诗中语句,借助联想和想象把握诗歌的意境,体会其中蕴含的思想感情,背诵五...