前言计算机视觉、目标检测算法岗必背核心,目前工业界落地最主流就是 YOLO 系列,面试高频问到网络结构、正负样本匹配、损失函数、锚框、训练技巧、数据集制作、端侧部署等全套考点,全篇精简背诵版,视觉项目面试直接满分作答。一、YOLO 整体核心思想全称:You Only Look Once核心思路:一阶段目标检测,直接回归目标位置 + 类别,无候选框生成流程优势:速度快、精度均衡、极易部署,工业落地首选流程:整张图送入网络 → 多尺度特征图预测 → 解码坐标 + 置信度 + 类别 → NMS 非极大值抑制筛框输出结果二、YOLOv5 整体三大模块1. Backbone 主干网络(特征提取)Focus 结构:切片拼接下采样,无损降维提速C3 模块:轻量化残差结构,高效提取深层语义特征SPPF 空间金字塔池化:融合多尺度感受野,适配大小目标作用:从原图提取浅层纹理、中层轮廓、高层语义特征2. Neck 颈部网络(特征融合)PANet 结构:自上而下 + 自下而上双向融合充分融合高低层特征,小目标用浅层细节,大目标用深层语义输出 3 个不同尺度特征图,分别负责大、中、小目标检测3. Head 检测头(结果预测)极简卷积头,直接预测三类信息目标中心点偏移、宽高缩放物体置信度类别概率3 尺度输出,适配不同尺寸物体三、锚框 Anchor 核心考点什么是锚框 预先设定好固定长宽比例的候选框,网络基于锚框微调偏