从论文到效果：手把手带你用AOD-NET给自己的雾天照片‘一键清透’（含训练与测试全流程）

张

张建站

2026/4/17 0:15:16

10分钟阅读

从论文到效果手把手带你用AOD-NET给自己的雾天照片‘一键清透’含训练与测试全流程清晨的黄山云雾缭绕本是绝美风景但当你翻出手机里那张被雾气笼罩的照片时是否总觉得少了些通透感三年前我在冰岛旅行时就遇到过这样的遗憾——明明肉眼可见的壮丽瀑布拍出来却像蒙了层毛玻璃。直到接触了AOD-NET这个端到端的图像去雾算法才发现原来通过深度学习我们完全可以自己动手拯救这些雾失楼台的废片。不同于传统需要估计大气散射模型的复杂方法AOD-NET的创新之处在于将去雾过程建模为单个轻量级网络输入雾图直接输出清晰图像。这种所见即所得的特性让非专业开发者也能快速上手实践。下面我将用最接地气的方式带你在Colab上完成从数据准备到模型部署的全流程最终实现对自己照片的智能去雾。1. 环境配置与工具选择工欲善其事必先利其器。考虑到大多数读者的设备条件我们选择Google Colab作为实验平台既免去了本地配置环境的繁琐又能利用免费的GPU资源加速训练。以下是需要提前准备的装备清单Colab Pro可选建议升级以获得更长时间的GPU使用权普通账号可能会在长时间训练时断开连接云存储方案推荐将数据集放在Google Drive避免每次重启环境重新上传必要库版本torch1.12.1cu113 torchvision0.13.1cu113 opencv-python4.6.0.66 numpy1.23.5实际操作中只需在Colab新建笔记本后通过以下命令一键完成环境准备!pip install torch1.12.1cu113 torchvision0.13.1cu113 --extra-index-url https://download.pytorch.org/whl/cu113 !pip install opencv-python numpy tqdm注意如果使用本地环境建议通过conda创建专属Python3.8环境避免与现有项目产生依赖冲突。Windows用户需要额外安装Visual Studio Build Tools以编译某些C扩展。2. 数据准备的艺术高质量的数据集是模型效果的基石。虽然原论文使用的NYU-Depth数据集效果不错但针对个人照片去雾我推荐采用混合数据策略数据集组合方案数据来源图片数量适用场景获取方式RESIDE标准集5000基础训练学术网站直接下载自己拍摄的雾景照片50-100微调适配手机拍摄后手动标注网络公开雾天图像300-500增强多样性Flickr等CC协议图片对于时间有限的读者我已将预处理好的小型数据集打包上传至Google Drive包含以下经过标准化的内容train/hazy: 512x512的有雾图像块train/gt: 对应的清晰图像test/real_world: 20张真实场景雾图数据增强是提升模型泛化能力的关键技巧。在加载数据集时建议加入以下变换组合transform transforms.Compose([ transforms.RandomCrop(256), transforms.RandomHorizontalFlip(), transforms.ColorJitter(brightness0.2, contrast0.2), transforms.ToTensor() ])3. 模型训练实战AOD-NET的精妙之处在于其紧凑的网络结构整个模型只有约0.3M参数却能达到与复杂模型媲美的效果。其核心是一个包含三个关键模块的编解码器特征提取层5个卷积块提取多尺度特征大气光估计模块通过通道注意力机制预测环境光透射率图生成结合前两者输出最终去雾结果在Colab中训练时这个配置模板能帮你避开大多数坑model AODNet().cuda() optimizer torch.optim.Adam(model.parameters(), lr1e-4, weight_decay1e-5) scheduler torch.optim.lr_scheduler.StepLR(optimizer, step_size10, gamma0.8) loss_func nn.L1Loss() SSIMLoss() # 结合L1与结构相似性损失训练过程中有几个需要特别监控的指标PSNR值28dB说明模型学习有效SSIM指数应保持在0.9以上验证集损失观察是否出现过拟合实用技巧当GPU内存不足时尝试将batch_size设为8-16并开启梯度累积。使用torch.utils.checkpoint可以进一步节省显存。4. 效果优化与部署技巧训练完成后用以下代码加载模型并对单张图片进行去雾处理def dehaze_image(model, img_path): img Image.open(img_path).convert(RGB) img_tensor transform(img).unsqueeze(0).cuda() with torch.no_grad(): output model(img_tensor) return tensor_to_pil(output[0])在实际应用中我发现这些优化策略能显著提升最终效果后处理融合将网络输出与CLAHE算法结果以7:3比例融合边缘增强对结果图使用非锐化掩模(Unsharp Mask)色彩校正保持HSV空间的V通道不变调整H/S与清晰图像对齐针对移动端部署可以使用以下命令将模型转换为ONNX格式torch.onnx.export(model, dummy_input, aodnet.onnx, input_names[input], output_names[output], dynamic_axes{input: {0: batch}, output: {0: batch}})5. 真实场景效果对比为了直观展示算法威力我选取了三种典型场景进行测试城市建筑雾图原始玻璃幕墙细节模糊整体发灰处理后建筑轮廓清晰可见恢复了金属质感自然风光照片原始远山完全被雾气吞噬处理后不仅山体显现还保留了雾气营造的空间层次感夜景雾图原始灯光严重散射形成光晕处理后光晕消除的同时保持夜景氛围在最后测试阶段建议创建对比网格更直观def create_comparison(hazy, dehazed, gtNone): fig, ax plt.subplots(1, 3 if gt else 2, figsize(15,5)) ax[0].imshow(hazy); ax[0].set_title(Hazy Input) ax[1].imshow(dehazed); ax[1].set_title(Dehazed Output) if gt: ax[2].imshow(gt); ax[2].set_title(Ground Truth)经过多次迭代优化现在我的个人摄影工作流已经离不开这个去雾工具——无论是修复阴天拍摄的风景照还是拯救雾霾天的工作样片都能在保持自然观感的前提下获得令人惊喜的清晰度提升。特别是在处理RAW格式照片时先进行去雾再进入常规调色流程成片质量往往有质的飞跃。

避免自激！AD8367用作AGC放大器时的PCB布局避坑指南与环路稳定性分析

避免自激！AD8367用作AGC放大器时的PCB布局避坑指南与环路稳定性分析在射频与中频电路设计中，AD8367作为一款高性能可变增益放大器(VGA)，因其宽增益范围(45dB)和集成平方律检波器特性，常被用于自动增益控制(AGC)系统。然而&#x…...

2026/4/14 8:05:14 阅读更多 →

保姆级教程：用AnyLogic轨道库快速搭建你的第一个地铁线路仿真模型

从零到一：用AnyLogic轨道库构建地铁环线仿真实战指南第一次打开AnyLogic时，面对密密麻麻的组件库和复杂的参数面板，多数初学者都会感到无从下手。轨道交通仿真作为工业仿真中最具视觉表现力的领域之一，其实可以通过轨道库快速搭…...

2026/4/14 4:49:08 阅读更多 →

别再只盯着串口了！用STM32F103的CAN总线实现Ymodem固件升级，保姆级移植教程

基于CAN总线的STM32固件升级实战：Ymodem协议在工业场景的深度适配在工业控制与汽车电子领域，固件升级的可靠性直接关系到设备运行的稳定性。传统串口升级方式在复杂电磁环境或多节点网络中往往力不从心，而CAN总线凭借其高可靠性和多主机特性…...

2026/4/14 22:33:10 阅读更多 →

为了过等保，我们给200+服务器做了OpenSSH 10.0自动化升级，这是完整复盘

企业级OpenSSH 10.0自动化升级实战：从合规需求到批量落地当安全合规成为企业IT建设的刚性需求，基础组件的漏洞修复便从技术问题升级为战略任务。去年某次内部审计中，我们发现全公司237台服务器中，68%的OpenSSH版本存在高危漏洞&a…...

2026/4/16 22:05:04 阅读更多 →

用AI给显示器装上‘眼睛’：复旦博士的EyeReal方案，如何用三层LCD和RTX 4090实现桌面级裸眼3D？

EyeReal技术解析：三层LCDRTX 4090如何重构裸眼3D显示范式当24英寸显示器上跃然而出的立体影像不再需要特制眼镜时，我们或许正站在显示技术革命的临界点。复旦大学马炜杰博士团队发表在《Nature》的EyeReal方案，用三层普通LCD面板和消费级显卡…...

2026/4/16 14:29:57 阅读更多 →

5步轻松打造个人离线小说图书馆：番茄小说下载器完全指南

5步轻松打造个人离线小说图书馆：番茄小说下载器完全指南【免费下载链接】Tomato-Novel-Downloader 番茄小说下载器不精简版项目地址: https://gitcode.com/gh_mirrors/to/Tomato-Novel-Downloader 番茄小说下载器是一款功能强大的开源工具，专为…...

2026/4/16 17:42:46 阅读更多 →