别再死记ResNet18结构图了！用PyTorch代码逐行拆解，搞懂残差连接到底怎么跑的

张

张建站

2026/6/6 22:09:33

10分钟阅读

别再死记ResNet18结构图了！用PyTorch代码逐行拆解，搞懂残差连接到底怎么跑的

用PyTorch代码逐行解析ResNet18残差连接的数据流动之谜当你第一次看到ResNet18的结构图时那些密密麻麻的箭头和方框是否让你感到困惑实线与虚线有什么区别1x1卷积到底在做什么本文将带你用PyTorch代码一步步拆解这个经典网络让你真正理解残差连接是如何工作的。1. 残差网络的核心思想传统的深度神经网络随着层数增加会出现梯度消失和网络退化问题。ResNet的创新之处在于引入了残差学习的概念——不再让网络直接学习目标映射而是学习目标映射与输入之间的残差。想象一下教小孩投篮与其让他直接从三分线投进篮筐难度大不如先让他站在篮下练习然后逐步后退。残差学习就是这个原理——网络只需要学习当前输出与理想输出之间的小差距。# 残差块的基本数学表达 output F(x) x # F(x)是残差函数x是恒等映射这种设计带来了两个关键优势梯度可以直接通过恒等映射反向传播缓解梯度消失网络可以更容易地学习微小调整而不是完整的复杂变换2. ResNet18的整体架构解析让我们先看看PyTorch官方实现的ResNet18结构import torchvision.models as models resnet18 models.resnet18() print(resnet18)输出显示网络由以下几部分组成初始卷积层 (conv1)批归一化层 (bn1)ReLU激活函数最大池化层 (maxpool)四个残差块阶段 (layer1-layer4)全局平均池化 (avgpool)全连接层 (fc)关键点四个残差块阶段分别包含[2, 2, 2, 2]个残差块共8个残差块。由于每个残差块有2个卷积层所以卷积层总数为1(初始conv) 8×2 17层加上最后的全连接层正好18层。3. 残差块的代码级解析PyTorch实现中的基础残差块BasicBlock代码如下class BasicBlock(nn.Module): expansion 1 def __init__(self, inplanes, planes, stride1, downsampleNone): super(BasicBlock, self).__init__() self.conv1 nn.Conv2d(inplanes, planes, kernel_size3, stridestride, padding1, biasFalse) self.bn1 nn.BatchNorm2d(planes) self.relu nn.ReLU(inplaceTrue) self.conv2 nn.Conv2d(planes, planes, kernel_size3, stride1, padding1, biasFalse) self.bn2 nn.BatchNorm2d(planes) self.downsample downsample self.stride stride def forward(self, x): identity x out self.conv1(x) out self.bn1(out) out self.relu(out) out self.conv2(out) out self.bn2(out) if self.downsample is not None: identity self.downsample(x) out identity out self.relu(out) return out关键组件解析组件作用参数说明conv1第一个3x3卷积stride决定是否下采样bn1批归一化加速训练稳定梯度conv2第二个3x3卷积固定stride1downsample下采样模块当维度不匹配时使用4. 实线与虚线的秘密维度匹配问题结构图中的实线和虚线实际上代表了残差连接是否需要处理维度不匹配的情况实线连接输入和输出维度完全相同可以直接相加发生在每个阶段内部的残差块之间例如layer1中的两个残差块之间虚线连接当跨阶段时特征图尺寸减半通道数翻倍需要下采样模块1x1卷积调整维度例如layer1到layer2的过渡# 下采样模块的典型实现 downsample nn.Sequential( nn.Conv2d(inplanes, planes * block.expansion, kernel_size1, stridestride, biasFalse), nn.BatchNorm2d(planes * block.expansion) )维度变化示例输入64通道112x112经过stride2的conv1后128通道56x56恒等映射也需要从64-128通道112-56尺寸5. 数据流动的完整追踪让我们跟踪一个224x224输入图像在ResNet18中的完整旅程初始卷积层x self.conv1(x) # 7x7卷积stride2输出通道64 x self.bn1(x) x self.relu(x) x self.maxpool(x) # 3x3池化stride2尺寸变化224 - 112 - 56通道变化3 - 64layer1阶段两个BasicBlock保持56x56尺寸实线连接无需下采样layer2阶段第一个BasicBlock使用stride2虚线连接通过1x1卷积下采样尺寸56 - 28通道64 - 128后续阶段layer328 - 14128 - 256layer414 - 7256 - 512最后通过全局平均池化得到512维向量6. 常见问题与调试技巧问题1维度不匹配错误检查残差连接两端的张量形状确保downsample模块正确配置问题2训练不稳定确认批归一化层处于训练模式检查残差连接是否真的起作用可以打印中间值调试技巧# 打印各层输出形状的实用函数 def print_shapes(model, input_size(1,3,224,224)): x torch.randn(input_size) for name, layer in model.named_children(): x layer(x) print(f{name}: {x.shape})7. 残差网络的变体与实践建议ResNet系列有多种变体区别主要在于残差块设计BasicBlock/Bottleneck网络深度18/34/50/101/152注意力机制引入ResNeXt实践建议对于小数据集ResNet18通常是足够的选择当需要更高精度时可以考虑ResNet50修改残差块时务必保持维度匹配原则# 自定义残差块的示例 class CustomBlock(nn.Module): def __init__(self, in_channels, out_channels): super().__init__() mid_channels in_channels // 4 self.conv1 nn.Conv2d(in_channels, mid_channels, 1) self.conv2 nn.Conv2d(mid_channels, mid_channels, 3, padding1) self.conv3 nn.Conv2d(mid_channels, out_channels, 1) self.bn nn.BatchNorm2d(out_channels) self.relu nn.ReLU() def forward(self, x): identity x out self.relu(self.conv1(x)) out self.relu(self.conv2(out)) out self.bn(self.conv3(out)) out identity return self.relu(out)理解ResNet的最好方式就是亲手实现它。我在第一次复现时最大的收获是认识到残差连接实际上创建了多条梯度传播路径这使得深层网络能够有效训练。当你自己用PyTorch写出这些代码后那些结构图中的箭头会突然变得清晰明了——它们不再是抽象的符号而是真实的数据流动路径。

告别重复造轮子，用快马平台ai一键生成rpg maker mv高效开发框架

告别重复造轮子，用快马平台ai一键生成rpg maker mv高效开发框架

快速体验打开 InsCode(快马)平台 https://www.inscode.net输入框内输入如下内容： 为了提高rpg游戏开发效率，请利用快马平台ai生成一个具备常用功能模块的rpg游戏框架，核心功能包括：一套完整的角色属性系统（如生命、…...

2026/6/6 22:06:20 阅读更多 →

GraphQL在ERP数据集成中的革命性应用：从N+1查询到批量优化的实践

GraphQL在ERP数据集成中的革命性应用：从N+1查询到批量优化的实践

ERP数据集成是企业数字化落地的核心痛点——传统RESTful API集成模式下，ERP与OA系统、BI工具、低代码平台的数据互通，往往陷入N1查询冗余、数据冗余传输、接口适配复杂的困境，不仅增加开发与运维成本，更影响数据同步效率&#xff…...

2026/6/6 22:03:37 阅读更多 →

AI东风下武汉光电子产业爆发，长进光子上市首日暴涨1500%，华科系收获超级回报

AI东风下武汉光电子产业爆发，长进光子上市首日暴涨1500%，华科系收获超级回报

长进光子上市：华科系斩获30倍回报上周，特种光纤厂商长进光子正式登陆科创板，发行价40.98元/股，首日暴涨超1500%，刷新今年A股新股纪录，截至目前，最新市值超630亿。这让身后投资人收获超级回报&am…...

2026/6/6 21:54:15 阅读更多 →

掌握Markdown实时预览：打造高效写作工作流的3个关键策略

掌握Markdown实时预览：打造高效写作工作流的3个关键策略

掌握Markdown实时预览：打造高效写作工作流的3个关键策略【免费下载链接】markn Lightweight markdown viewer. 项目地址: https://gitcode.com/gh_mirrors/ma/markn 在当今数字创作时代，Markdown已成为技术文档、博客文章和个人笔记的首选格式。…...

2026/6/5 8:33:56 阅读更多 →

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Win10/Win11下Realtek 8188GU网卡驱动感叹号？别急着扔，试试这个手动安装的野路子

Realtek 8188GU网卡驱动故障深度修复指南：从原理到实战当设备管理器里那个顽固的黄色感叹号挥之不去，而你已经尝试了所有"标准操作"——Windows自动更新、第三方驱动工具、甚至重启大法——却依然无济于事时，是时候换个思路了。这篇…...

2026/6/5 5:07:10 阅读更多 →

前轮驱动自行车机器人建模与自适应控制策略优化【附代码】

前轮驱动自行车机器人建模与自适应控制策略优化【附代码】

✨ 长期致力于自行车机器人、前轮驱动、Lagrange方程、自适应模糊控制、RBF网络自适应控制研究工作，擅长数据搜集与处理、建模仿真、程序编写、仿真设计。 ✅ 专业定制毕设、代码 ✅ 如需沟通交流，点击《获取方式》 （1）基于瞬时转…...

2026/6/5 5:07:29 阅读更多 →

ModTheSpire终极指南：5分钟安全安装《杀戮尖塔》模组管理器

ModTheSpire终极指南：5分钟安全安装《杀戮尖塔》模组管理器

ModTheSpire终极指南：5分钟安全安装《杀戮尖塔》模组管理器【免费下载链接】ModTheSpire External mod loader for Slay The Spire 项目地址: https://gitcode.com/gh_mirrors/mo/ModTheSpire 还在为《杀戮尖塔》模组安装的复杂流程而头疼吗？Mod…...

2026/6/4 8:10:02 阅读更多 →