一、开篇:遥感目标检测的“长条困境”在遥感图像处理领域,有一个长期困扰研究者的问题:怎么有效检测那些“细长条”形状的目标?遥感图像与自然图像存在本质区别。自然图像中,目标通常以正常的宽高比呈现——行人、车辆、动物,大部分目标的宽高比在 1:1 到 3:1 之间。但在遥感图像中,情况完全不同。根据 AAAI 2026 正式发表的 Strip R-CNN 论文,传统的使用大方核卷积或基于 Transformer 的全局建模方法在聚合上下文信息时,会均匀地覆盖所有空间维度,导致细长目标的特征被稀释,定位出现偏差。同时,DENet 论文也指出,光学遥感船舶检测面临着严峻挑战:强烈的背景杂波(如码头、海岸线、尾流条纹)、极端的尺度变化,以及船舶本身细长的几何形状和多样化的朝向,这些因素频繁导致几何对齐偏差、定位不稳定和虚警问题。具体来说,传统卷积面临三大痛点:痛点一:感受野与目标形状不匹配。标准 3×3 或 5×5 的方形卷积核在处理一艘长达 200 像素、宽仅 20 像素的船舶时,要么感受野太小无法覆盖整个目标,要么为了扩大感受野而增大卷积核尺寸,但同时引入了大量来自垂直方向的背景噪声。痛点二:各向异性信息捕获能力弱。方形卷积核天然具有各向同性的特点——在各个方向上等距地聚合信息。但在遥感场景中,桥梁、船舶、飞机等目标的方向性特征极为重要。用方形卷积去学习这些各向异性模式,无异于“削足适履”。痛点三:计算效率与感受野的矛盾。要增