别再死记ResNet结构图了！用PyTorch代码逐行拆解34层网络（附参数表对照）

张

张建站

2026/6/5 12:13:49

10分钟阅读

别再死记ResNet结构图了！用PyTorch代码逐行拆解34层网络（附参数表对照）

用PyTorch代码透视ResNet-34从参数表到可运行模型的实战指南当你第一次看到ResNet的结构图和参数表时是否感觉像在解读某种神秘符号那些密密麻麻的箭头、方块和数字确实容易让人望而生畏。但别担心我们今天要做的不是死记硬背这些图表而是通过PyTorch代码将它们翻译成可运行、可调试的真实模型。这种方法不仅能帮你真正理解ResNet的精髓还能让你在需要修改或扩展网络时游刃有余。1. 准备工作理解ResNet的核心构件在开始编码之前我们需要明确几个关键概念。ResNet残差网络之所以能在深度学习中大放异彩主要归功于它的残差块设计。这种设计通过引入捷径连接shortcut connection让网络能够学习输入与输出之间的残差即差异而非直接学习输出这有效缓解了深层网络中的梯度消失问题。1.1 残差块的基本结构一个标准的残差块包含两个主要部分主路径通常由两个3×3卷积层组成每层后接批量归一化BatchNorm和ReLU激活捷径路径当输入输出维度匹配时直接连接恒等映射不匹配时通过1×1卷积调整维度import torch import torch.nn as nn class BasicBlock(nn.Module): expansion 1 def __init__(self, in_channels, out_channels, stride1): super().__init__() self.conv1 nn.Conv2d(in_channels, out_channels, kernel_size3, stridestride, padding1, biasFalse) self.bn1 nn.BatchNorm2d(out_channels) self.relu nn.ReLU(inplaceTrue) self.conv2 nn.Conv2d(out_channels, out_channels, kernel_size3, stride1, padding1, biasFalse) self.bn2 nn.BatchNorm2d(out_channels) # 捷径连接 self.shortcut nn.Sequential() if stride ! 1 or in_channels ! out_channels * self.expansion: self.shortcut nn.Sequential( nn.Conv2d(in_channels, out_channels * self.expansion, kernel_size1, stridestride, biasFalse), nn.BatchNorm2d(out_channels * self.expansion) ) def forward(self, x): identity self.shortcut(x) out self.conv1(x) out self.bn1(out) out self.relu(out) out self.conv2(out) out self.bn2(out) out identity out self.relu(out) return out1.2 ResNet-34的层级结构ResNet-34由以下几个主要部分组成层级名称输出尺寸构建块类型重复次数输出通道conv1112×1127×7卷积164conv2_x56×563×3最大池化残差块364conv3_x28×28残差块4128conv4_x14×14残差块6256conv5_x7×7残差块3512分类头1×1全局平均池化全连接11000这个表格实际上就是参数表的代码友好版本我们将在后续编码中严格遵循这个结构。2. 从零构建ResNet-34模型现在让我们把这些理论知识转化为实际的PyTorch代码。我们将采用自底向上的构建方式先实现基础组件再组装完整网络。2.1 初始卷积层与池化层ResNet的第一部分是一个相对独立的预处理阶段def _make_layer(self, block, out_channels, blocks, stride1): layers [] # 第一个块可能需要下采样 layers.append(block(self.in_channels, out_channels, stride)) self.in_channels out_channels * block.expansion # 后续块保持维度不变 for _ in range(1, blocks): layers.append(block(self.in_channels, out_channels)) return nn.Sequential(*layers)2.2 构建残差层组ResNet的核心是由多个残差层组conv2_x到conv5_x构成的。每个层组内部包含多个残差块且第一个块可能需要进行下采样def _make_layer(self, block, out_channels, blocks, stride1): layers [] # 第一个块可能需要下采样 layers.append(block(self.in_channels, out_channels, stride)) self.in_channels out_channels * block.expansion # 后续块保持维度不变 for _ in range(1, blocks): layers.append(block(self.in_channels, out_channels)) return nn.Sequential(*layers)2.3 完整ResNet-34实现现在我们可以将所有部分组合起来构建完整的ResNet-34class ResNet(nn.Module): def __init__(self, block, layers, num_classes1000): super().__init__() self.in_channels 64 # 初始卷积层 self.conv1 nn.Conv2d(3, 64, kernel_size7, stride2, padding3, biasFalse) self.bn1 nn.BatchNorm2d(64) self.relu nn.ReLU(inplaceTrue) self.maxpool nn.MaxPool2d(kernel_size3, stride2, padding1) # 残差层组 self.layer1 self._make_layer(block, 64, layers[0]) self.layer2 self._make_layer(block, 128, layers[1], stride2) self.layer3 self._make_layer(block, 256, layers[2], stride2) self.layer4 self._make_layer(block, 512, layers[3], stride2) # 分类头 self.avgpool nn.AdaptiveAvgPool2d((1, 1)) self.fc nn.Linear(512 * block.expansion, num_classes) def forward(self, x): x self.conv1(x) x self.bn1(x) x self.relu(x) x self.maxpool(x) x self.layer1(x) x self.layer2(x) x self.layer3(x) x self.layer4(x) x self.avgpool(x) x torch.flatten(x, 1) x self.fc(x) return x要实例化ResNet-34我们只需要def resnet34(num_classes1000): return ResNet(BasicBlock, [3, 4, 6, 3], num_classes)这里的[3, 4, 6, 3]对应着conv2_x到conv5_x中残差块的重复次数这正是ResNet-34与其它变体如ResNet-18或ResNet-50的主要区别。3. 代码与结构图的对照解析现在让我们将代码与原始结构图进行逐项对照理解每一部分的具体含义。3.1 初始卷积层conv1在结构图中这部分通常表示为输入 - [7×7, 64, stride2] - BN - ReLU - MaxPool[3×3, stride2]对应我们的代码self.conv1 nn.Conv2d(3, 64, kernel_size7, stride2, padding3, biasFalse) self.bn1 nn.BatchNorm2d(64) self.relu nn.ReLU(inplaceTrue) self.maxpool nn.MaxPool2d(kernel_size3, stride2, padding1)关键参数解析输入通道3RGB图像输出通道64卷积核大小7×7步长2下采样填充3保持空间维度3.2 conv2_x层组在结构图中conv2_x包含3个残差块每个块由两个3×3卷积组成。第一个残差块的步长为1不进行下采样后续块保持维度不变。代码实现self.layer1 self._make_layer(BasicBlock, 64, 3, stride1)重要细节输入输出通道均为643个残差块第一个块的步长为1保持分辨率3.3 conv3_x到conv5_x层组这些层组的结构类似主要区别在于输出通道数逐渐增加128, 256, 512每个层组的第一个残差块进行下采样stride2残差块数量不同4,6,3self.layer2 self._make_layer(BasicBlock, 128, 4, stride2) # conv3_x self.layer3 self._make_layer(BasicBlock, 256, 6, stride2) # conv4_x self.layer4 self._make_layer(BasicBlock, 512, 3, stride2) # conv5_x3.4 虚线连接的实现结构图中的虚线连接表示需要进行维度调整的捷径连接。在代码中这通过检查输入输出通道和步长来实现if stride ! 1 or in_channels ! out_channels * self.expansion: self.shortcut nn.Sequential( nn.Conv2d(in_channels, out_channels * self.expansion, kernel_size1, stridestride, biasFalse), nn.BatchNorm2d(out_channels * self.expansion) )4. 模型验证与调试技巧构建完模型后我们需要验证其是否符合预期。以下是一些实用技巧4.1 检查参数量与结构model resnet34() print(model) # 打印模型结构 total_params sum(p.numel() for p in model.parameters()) print(f总参数量: {total_params:,}) # 应约为21.8M4.2 前向传播测试# 创建一个随机输入张量模拟batch_size1的224×224 RGB图像 dummy_input torch.randn(1, 3, 224, 224) output model(dummy_input) print(f输出形状: {output.shape}) # 应为torch.Size([1, 1000])4.3 梯度流动检查# 反向传播测试 output.sum().backward() for name, param in model.named_parameters(): if param.grad is None: print(f警告: {name} 没有梯度)4.4 常见问题排查表问题现象可能原因解决方案输出尺寸不符输入图像尺寸不是224×224调整输入尺寸或修改网络适应不同尺寸梯度消失残差连接实现错误检查捷径连接是否正确相加训练不稳定BN层未正确初始化确认BN层在训练模式参数量异常通道数设置错误核对各层输入输出通道5. 扩展应用从ResNet-34到其他变体理解了ResNet-34的实现原理后我们可以轻松扩展到其他ResNet变体。主要区别在于5.1 ResNet-18 vs ResNet-34特征ResNet-18ResNet-34残差块类型BasicBlockBasicBlockconv2_x块数23conv3_x块数24conv4_x块数26conv5_x块数23总层数1834实现ResNet-18只需修改层数def resnet18(num_classes1000): return ResNet(BasicBlock, [2, 2, 2, 2], num_classes)5.2 ResNet-50及更深的变体更深层次的ResNet使用Bottleneck块来减少计算量class Bottleneck(nn.Module): expansion 4 def __init__(self, in_channels, out_channels, stride1): super().__init__() self.conv1 nn.Conv2d(in_channels, out_channels, kernel_size1, biasFalse) self.bn1 nn.BatchNorm2d(out_channels) self.conv2 nn.Conv2d(out_channels, out_channels, kernel_size3, stridestride, padding1, biasFalse) self.bn2 nn.BatchNorm2d(out_channels) self.conv3 nn.Conv2d(out_channels, out_channels * self.expansion, kernel_size1, biasFalse) self.bn3 nn.BatchNorm2d(out_channels * self.expansion) self.relu nn.ReLU(inplaceTrue) self.shortcut nn.Sequential() if stride ! 1 or in_channels ! out_channels * self.expansion: self.shortcut nn.Sequential( nn.Conv2d(in_channels, out_channels * self.expansion, kernel_size1, stridestride, biasFalse), nn.BatchNorm2d(out_channels * self.expansion) ) def forward(self, x): identity self.shortcut(x) out self.conv1(x) out self.bn1(out) out self.relu(out) out self.conv2(out) out self.bn2(out) out self.relu(out) out self.conv3(out) out self.bn3(out) out identity out self.relu(out) return out然后可以轻松实现ResNet-50def resnet50(num_classes1000): return ResNet(Bottleneck, [3, 4, 6, 3], num_classes)5.3 自定义修改技巧掌握了ResNet的核心结构后你可以灵活地进行各种修改调整输入分辨率修改初始卷积层的stride和pooling参数更改通道基数增加或减少各层的通道数如将64改为32以减小模型添加注意力机制在残差块中插入SE或CBAM模块修改分类头适应不同数量的类别# 示例减小模型尺寸的变体 def tiny_resnet(num_classes1000): model ResNet(BasicBlock, [2, 2, 2, 2], num_classes) # 减少通道数 model.conv1 nn.Conv2d(3, 32, kernel_size3, stride1, padding1, biasFalse) model.in_channels 32 return model通过这种代码驱动的学习方式你不仅能理解ResNet的结构还能获得修改和创新的能力。下次当你看到复杂的网络结构图时不妨尝试将其转化为代码——这往往是理解它们的最佳途径。

Overleaf + arXiv 无缝投稿指南：如何一键打包并避开.eps图片的坑

Overleaf arXiv 无缝投稿全流程：从编译优化到矢量图处理实战当你完成了一篇精心打磨的学术论文，准备在arXiv上分享研究成果时，最不希望遇到的就是技术性障碍打断这一过程。作为全球最大的预印本平台，arXiv对提交文件有着特定的技…...

2026/6/5 12:11:40 阅读更多 →

不想 ZUI 越更越难用？手把手教你向官方提交功能建议与 BUG 反馈

不少拯救者手机用户长期使用 ZUI 系统，日常使用中总会萌生各类优化想法：想要新增快捷小部件、优化游戏领域弹窗逻辑、完善深浅模式自定义，或是遇到系统卡顿、APP 兼容异常等隐性 BUG。很多人习惯在社交平台、评论区吐槽系统短板，但…...

2026/6/5 12:11:13 阅读更多 →

汽车电气系统接地优化：从原理到实践的完整解决方案

1. 项目概述：为什么我们需要关注汽车地线？如果你是一位汽车电子工程师、改装爱好者，或者只是对爱车的电气性能有些不满的车主，那么“地线”这个词你一定不陌生。在日常的车辆维护、性能升级甚至是故障排查中，地线系统—…...

2026/6/5 12:08:07 阅读更多 →

掌握Markdown实时预览：打造高效写作工作流的3个关键策略

掌握Markdown实时预览：打造高效写作工作流的3个关键策略【免费下载链接】markn Lightweight markdown viewer. 项目地址: https://gitcode.com/gh_mirrors/ma/markn 在当今数字创作时代，Markdown已成为技术文档、博客文章和个人笔记的首选格式。…...

2026/6/5 8:33:56 阅读更多 →

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…...

2026/6/5 5:07:10 阅读更多 →

前轮驱动自行车机器人建模与自适应控制策略优化【附代码】

✨ 长期致力于自行车机器人、前轮驱动、Lagrange方程、自适应模糊控制、RBF网络自适应控制研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 （1）基于瞬时转…...

2026/6/5 5:07:29 阅读更多 →

ModTheSpire终极指南：5分钟安全安装《杀戮尖塔》模组管理器

ModTheSpire终极指南：5分钟安全安装《杀戮尖塔》模组管理器【免费下载链接】ModTheSpire External mod loader for Slay The Spire 项目地址: https://gitcode.com/gh_mirrors/mo/ModTheSpire 还在为《杀戮尖塔》模组安装的复杂流程而头疼吗？Mod…...

2026/6/4 8:10:02 阅读更多 →