当前位置:网站首页 > R语言数据分析 > 正文

resnet网络代码(resnet1)



这篇文章是用来讲解Resnet(残差网络)代码的,结合代码理解残差网络结构。

目录

Bottleneck类

Conv3×3

Conv1×1 

BasicBlock 

ResNet

 _make_layer代码解析

完整的ResNet代码:


可以直接调用torch内置的resnet官方代码。

 
   

不论是调用resnet50还是resnet101,这些模型都是调用的Resnet模型。因此我们仅需要看这个类就可以。

在ResNet这个类中又由Bottleneck(瓶颈层)、3×3卷积层1×1卷积层BasicBlock组成。接下来将逐步解释

拼劲层这个类在resnet50及之后的系列用这个,resnet18、resnet34BasicBlock

参数说明:

        expansion=4:Bottleneck的输出通道数是输入通道数的4背

        inplanes:输入通道数

        planes:输出通道数

        stride:步长

        downsample:下采样

        groups:分组卷积

        base_width:卷积块宽度

        dilation:空洞卷积

        nor_layer:是否传入norm_layer

 
   

下面这张图是一个Bottleneck结构图,残差边为一个1x1的卷积。 

传入参数:

in_planes:输入通道

out_planes:输出通道

stride:步长

groups:卷积分组数

dilation:可以控制空洞卷积

可以看到这个conv3×3中的kernel_size为3,bias为False,padding的大小和dilation一样。

 
   

in_planes:输入通道数

out_planes:输出通道数

可以看到kernel_size为1,bias为False

 
   

这个BasicBlock当在resnet18、resnet34用这个

传入参数:

inplanes:输入通道数

planes:输出通道数

stride:步长

downsample:下采样

groups:分组数

base_width:宽度

当norm_layer为None的时候,则norm_layer为BN层。当采用groups(分组卷积)或者base_width不为64的时候抛出错误:

'BasicBlock only supports groups=1 and base_width=64'

该错误表示在BasicBlock仅支持groups=1和base_width=64

当dilation>1的时候,表示在BasicBlock采用了空洞卷积,抛出错误。 

 
   

可以看到在BasicBlock(基础块)中当需要进行下采样的时候,残差边需要一次下采样。


在正式讲Resnet之前需要讲一下_make_layer函数,因为网络结构中的残差层都是由这个函数决定的。

参数说明:

        block:传入BasicBlock还是Bottleneck

        planes:输出通道数

        blocks:传入的layer

        stride:步长,默认为1

        dilate:是否采用空洞卷积,默认为False

这里以不采用空洞卷积,也就是dilate=False,block取Bottlenenck为例。

 
    

上面这段代码表示什么时候采用下采样的情况,当stride不为1,或者通道数inplanes(初始默认取值64) ≠ planes * block.expansion(此时block.expansion=4)。输入和输出通道不相等时候,下采样结构定义为

downsample:

        (conv1×1:conv2d(inplanes,4*planes,stride),

        norm_layer:BN)

 
    

上面这段代码表示,创建一个空的列表layers, 此时的block为Bottleneck,将获得的Bottlenck放入layers列表中。放入以后下一层的inplanes输入通道数为变成上一层输出通道数planes的4倍【也就是为下一个block做准备】。

 
    

而上面这一段代码就是表示当前的Bottleneck会重复几次(不过需要注意的是,在每个layer中只在第一个bottleneck用了1x1的残差边)。

 
    

接下来是一步一步看ResNet中的代码。

参数说明:

block:表示传入BasicBlock或者Bottleneck层。

layers:传入的是个列表,可以通过获取layers[index]来控制stride,以及是否采用空洞卷积。

num_classes:分类数量

zero_init_residual:初始化

groups:分组数

replace_stride_with_dilation:表示是否传入空洞卷积参数。如果不指定,则赋值为 [False, False, False],表示不使用空洞卷积。

norm_layer:是否传入norm_layer层,不传入的时候则为BN层。

 
    

代码讲解将以Resnet50为例,那么此时传入的block就为Bottleneck,layer=[3,4,6,3],num_classes=1000,其他Resnet系列可以看下面这张图。在看代码的时候希望大家可以对着下面这个图来看,方便理解。

 先看下下面这几行代码,可以看到这三行代码是由一个输入通道为3,输出通道为64,k=7,s=2,paddind=3,bn层,relu函数构成的,这正好就对应到上面图中的conv1

 
     

 然后再看conv2_x。conv2_x是由一个最大池化,还有3个Bottleneck组成(你可以理解为图中的3,4,6,3就是这类结构重复次数)。

 
     

代码中的layer1调用的是_make_layer函数, 

下面这张图为layer1,表示为第一个bottleneck结构。在Resnet的每个Bottlenck中,只在第一个Bottlenck处的残差边会用1x1的卷积进行升维,其他的都是输入和输出直接相加,这个特点需要注意一下。

 
     

 然后看layer2,3,4,过程和layer1是一样的,只不过这里传入的stride=2.

 
     

最后就是连接一个平均池化和全连接用来分类。

 
     

所以可以进行一个总结:

_make_layer函数用来制作残差块的结构,参数layer可以用来控制每个残差层是由多少个残差块组成的,在残差块结构中判断是否采用downsample(1x1卷积进行升维)是根据步长或者输入输出通道数是否相等,如果步长为1,输入通道数不等于输出通道数就会采用一个1x1卷积进行升维。每个残差层layer只有第一个残差块是采用了downsample。 


后续将结合这一部分做知识蒸馏的讲解,请持续关注

到此这篇resnet网络代码(resnet1)的文章就介绍到这了,更多相关内容请继续浏览下面的相关推荐文章,希望大家都能在编程的领域有一番成就!

版权声明


相关文章:

  • yarn装包(yarn打包)2025-10-17 13:09:05
  • traceable官方旗舰店(traceable户外品牌什么档次)2025-10-17 13:09:05
  • trace(traceroute命令怎么用)2025-10-17 13:09:05
  • airplay2(airplay2是什么意思)2025-10-17 13:09:05
  • 发送验证码手机收不到怎么办realme(realme无法接收验证码)2025-10-17 13:09:05
  • swagger2配置文件(swagger2 配置)2025-10-17 13:09:05
  • autokey怎么用(auto keyboard)2025-10-17 13:09:05
  • lvcreate(lvcreate命令详解)2025-10-17 13:09:05
  • rmsprop算法(rmq算法)2025-10-17 13:09:05
  • zipsigner签名教程(zip sign)2025-10-17 13:09:05
  • 全屏图片