突破遥感小目标检测瓶颈!空间 - 通道协同注意力多尺度检测网络重磅发布
点击蓝字关注我们关注并星标从此不迷路计算机视觉研究院公众号ID计算机视觉研究院学习群扫码在主页获取加入方式https://pmc.ncbi.nlm.nih.gov/articles/PMC12944585/pdf/sensors-26-01370.pdf计算机视觉研究院专栏Column of Computer Vision Institute针对遥感图像目标尺度差异悬殊、背景复杂杂乱、小目标特征微弱三大行业痛点本文提出一种融合空间 - 通道协同注意力的多尺度目标检测网络在三大公开遥感数据集上实现检测精度与计算效率双突破为复杂场景遥感目标检测提供轻量化实用方案。PART/1痛点遥感图像目标检测广泛应用于资源监测、城市规划、军事侦察等领域但超高分辨率带来的场景复杂性成为检测模型的核心挑战目标尺度极端变化大目标轮廓易模糊小目标仅占数像素、特征极易丢失背景杂乱干扰强复杂纹理、噪声、阴影易掩盖目标特征类间相似度高不同目标视觉特征接近易出现误检。遥感图像典型挑战a 尺度差异、b 复杂背景、c 类间相似现有模型存在两大短板一是固定尺寸卷积核无法兼顾多尺度特征提取二是通道与空间注意力简单拼接导致特征冗余、计算成本过高难以落地资源受限场景。PART/2创新本次研究打造轻量级多尺度检测框架核心包含两大创新模块从特征提取与注意力优化双重维度破解难题。1. 跨通道多尺度特征提取模块CC-MSFE将输入特征按通道分组通过深度可分离卷积实现多尺度特征并行提取跨通道特征交叉融合强化小目标细节感知同时几乎不增加计算量多分支并行结构兼顾全局感知与局部细节适配遥感目标尺度差异。2. 通道 - 空间交叉注意力机制CSCA由通道注意力CA 空间注意力SA 交叉注意力融合模块CAFM组成CA精准校准关键通道放大有效特征、抑制噪声SA聚焦目标空间位置捕捉大范围上下文信息CAFM实现通道与空间特征双向交互融合消除冗余、降低计算开销。模型整体框架MSFENetCSCANet 多尺度检测头PART/3实验研究在DIOR、HRRSD、RSOD三大权威遥感数据集开展测试结果全面超越 Faster R-CNN、YOLOv11、YOLOv8 等主流模型同时保持极致轻量化。核心检测精度mAPDIOR 数据集78.1%超 YOLOv11 0.7%HRRSD 数据集90.6%超 YOLOv11 1.4%RSOD 数据集96.5%超 YOLOv8 2.1%。轻量化优势模型参数仅19.5M计算量75.2G FLOPs远低于同类高精度模型完美平衡检测精度与部署效率。DIOR 数据集各模型定量对比HRRSD 数据集各模型定量对比RSOD 数据集各模型定量对比三大数据集 P-R 曲线对比各模型检测结果可视化对比消融实验验证ablation 结果证实CC-MSFE 模块显著提升中小目标检测精度CSCA 机制让特征聚焦更精准两大模块协同使模型性能最大化。模块消融实验与注意力机制对比结果PART/4总结与未来方向核心结论本网络通过跨通道多尺度特征提取 空间 - 通道交叉注意力融合有效解决遥感图像多尺度目标检测难题在复杂背景、小目标、密集场景下表现优异同时实现轻量化设计具备极强的工程落地价值。未来方向下一步将优化模型抗干扰能力适配云、雾、噪声等真实复杂遥感场景进一步提升推理速度与泛化性能。有相关需求的你可以联系我们END转载请联系本公众号获得授权计算机视觉研究院学习群等你加入ABOUT计算机视觉研究院计算机视觉研究院主要涉及深度学习领域主要致力于目标检测、目标跟踪、图像分割、OCR、模型量化、模型部署等研究方向。研究院每日分享最新的论文算法新框架提供论文一键下载并分享实战项目。研究院主要着重”技术研究“和“实践落地”。研究院会针对不同领域分享实践过程让大家真正体会摆脱理论的真实场景培养爱动手编程爱动脑思考的习惯往期推荐YOLO-TLA一种基于 YOLOv5 的高效轻量级小目标检测模型ViT-YOLO基于Transformer的用于目标检测的YOLO算法SSMA-YOLO一种轻量级的 YOLO 模型具备增强的特征提取与融合能力适用于无人机航拍的船舶图像检测LUD-YOLO一种用于无人机的新型轻量级目标检测网络Gold-YOLO基于聚合与分配机制的高效目标检测器Drone-YOLO一种有效的无人机图像目标检测「无人机AI」“空中城管”无人机AI光伏巡检自动化解决方案无人机视角下多类别船舶检测及数量统计机场项目解决飞行物空间大小/纵横比、速度、遮挡等问题引起的实时目标检测问题2PCNet昼夜无监督域自适应目标检测附原代码YOLO-S小目标检测的轻量级、精确的类YOLO网络大改Yolo框架 | 能源消耗极低的目标检测新框架附论文下载改进的检测算法用于高分辨率光学遥感图像目标检测