YOLOv5目标检测实战：从训练到部署全流程指南

张

张建站

2026/7/4 2:35:51

10分钟阅读

1. YOLOv5目标检测算法概述YOLOv5作为当前最流行的单阶段目标检测算法之一已经在工业界和学术界获得了广泛应用。这个基于PyTorch框架实现的算法相比前代YOLO系列在速度和精度上都有显著提升。我最近完成了一个完整的YOLOv5项目实践从环境搭建到模型训练再到部署应用积累了不少实战经验今天就来详细分享一下。YOLO(You Only Look Once)的核心思想是将目标检测视为一个回归问题直接在图像上预测边界框和类别概率。这种端到端的设计使其具有极高的推理速度特别适合实时应用场景。YOLOv5在保持这一优势的同时通过引入新的网络结构和训练技巧进一步提升了检测性能。2. 环境配置与项目搭建2.1 基础环境准备首先需要搭建Python开发环境。我推荐使用Anaconda来管理Python环境这样可以避免不同项目间的依赖冲突。以下是具体步骤安装Anaconda从官网下载对应版本的Anaconda安装包按照向导完成安装创建虚拟环境conda create -n yolov5 python3.8 conda activate yolov5安装PyTorchpip install torch torchvision torchaudio --extra-index-url https://download.pytorch.org/whl/cu113注意PyTorch版本需要与CUDA版本匹配。如果使用GPU加速请先确认显卡驱动和CUDA已正确安装。2.2 YOLOv5源码获取与配置官方YOLOv5代码托管在GitHub上我们可以直接克隆最新版本git clone https://github.com/ultralytics/yolov5 cd yolov5 pip install -r requirements.txt如果网络环境不佳也可以直接下载源码压缩包wget https://github.com/ultralytics/yolov5/archive/refs/tags/v6.0.tar.gz tar -xzvf v6.0.tar.gz3. 数据集准备与标注3.1 数据集选择与处理YOLOv5支持多种公开数据集如COCO、VOC等。如果要训练自定义数据集需要按照以下格式组织datasets/ custom/ images/ train/ img1.jpg img2.jpg ... val/ img1.jpg img2.jpg ... labels/ train/ img1.txt img2.txt ... val/ img1.txt img2.txt ...每个标注文件(.txt)的格式为class_id x_center y_center width height其中坐标值都是相对于图像宽高的归一化值(0-1)。3.2 数据增强策略YOLOv5内置了丰富的数据增强方法可以在data/hyps/hyp.scratch.yaml中配置# Hyperparameters lr0: 0.01 # initial learning rate lrf: 0.2 # final learning rate (lr0 * lrf) momentum: 0.937 # SGD momentum weight_decay: 0.0005 # optimizer weight decay warmup_epochs: 3.0 # warmup epochs warmup_momentum: 0.8 # warmup initial momentum warmup_bias_lr: 0.1 # warmup initial bias lr box: 0.05 # box loss gain cls: 0.5 # cls loss gain cls_pw: 1.0 # cls BCELoss positive_weight obj: 1.0 # obj loss gain obj_pw: 1.0 # obj BCELoss positive_weight iou_t: 0.20 # IoU training threshold anchor_t: 4.0 # anchor-multiple threshold fl_gamma: 0.0 # focal loss gamma hsv_h: 0.015 # image HSV-Hue augmentation hsv_s: 0.7 # image HSV-Saturation augmentation hsv_v: 0.4 # image HSV-Value augmentation degrees: 0.0 # image rotation (/- deg) translate: 0.1 # image translation (/- fraction) scale: 0.5 # image scale (/- gain) shear: 0.0 # image shear (/- deg) perspective: 0.0 # image perspective (/- fraction), range 0-0.001 flipud: 0.0 # image flip up-down (probability) fliplr: 0.5 # image flip left-right (probability) mosaic: 1.0 # image mosaic (probability) mixup: 0.0 # image mixup (probability) copy_paste: 0.0 # segment copy-paste (probability)4. 模型训练与调优4.1 训练参数配置YOLOv5提供了多种预训练模型从轻量级到高精度yolov5n (nano)yolov5s (small)yolov5m (medium)yolov5l (large)yolov5x (extra large)训练命令示例python train.py --img 640 --batch 16 --epochs 100 --data coco.yaml --weights yolov5s.pt关键参数说明--img: 输入图像尺寸--batch: 批次大小--epochs: 训练轮数--data: 数据集配置文件--weights: 预训练权重4.2 训练过程监控YOLOv5集成了TensorBoard和WB等工具可以方便地监控训练过程tensorboard --logdir runs/train训练完成后可以在runs/train/exp目录下找到训练日志模型权重文件(.pt)评估指标可视化结果5. 模型评估与测试5.1 评估指标解读YOLOv5会自动计算以下指标mAP0.5: IoU阈值为0.5时的平均精度mAP0.5:0.95: IoU阈值从0.5到0.95的平均精度Precision: 精确率Recall: 召回率测试命令python val.py --weights yolov5s.pt --data coco.yaml --img 6405.2 推理测试使用训练好的模型进行目标检测python detect.py --weights yolov5s.pt --source data/images/支持多种输入源单张图片图片目录视频文件摄像头网络流6. 模型导出与部署6.1 模型格式转换YOLOv5支持导出多种格式python export.py --weights yolov5s.pt --include torchscript onnx coreml tflite常见部署格式TorchScript: PyTorch原生格式ONNX: 通用中间格式CoreML: Apple设备格式TFLite: TensorFlow Lite格式6.2 移动端部署示例以Android为例使用ONNX Runtime进行推理导出ONNX模型python export.py --weights yolov5s.pt --include onnx在Android项目中集成ONNX Runtime// 加载模型 OrtEnvironment env OrtEnvironment.getEnvironment(); OrtSession.SessionOptions options new OrtSession.SessionOptions(); OrtSession session env.createSession(yolov5s.onnx, options); // 准备输入 float[][][][] inputData preprocess(image); OnnxTensor tensor OnnxTensor.createTensor(env, inputData); // 运行推理 OrtSession.Result result session.run(Collections.singletonMap(images, tensor)); // 解析输出 float[][][] output (float[][][]) result.get(0).getValue();7. 常见问题与解决方案7.1 训练问题排查问题1Loss不下降可能原因学习率设置不当数据标注错误模型容量不足解决方案调整学习率检查数据质量换用更大的模型问题2过拟合表现训练集指标高但验证集指标低解决方案增加数据量使用数据增强添加正则化7.2 部署问题排查问题1推理速度慢可能原因模型过大硬件加速未启用解决方案使用更小的模型启用TensorRT加速问题2精度下降可能原因量化损失预处理不一致解决方案使用FP32精度统一预处理流程8. 性能优化技巧8.1 训练加速使用混合精度训练python train.py --img 640 --batch 16 --epochs 100 --data coco.yaml --weights yolov5s.pt --device 0 --half多GPU训练python train.py --img 640 --batch 64 --epochs 100 --data coco.yaml --weights yolov5s.pt --device 0,18.2 推理优化TensorRT加速python export.py --weights yolov5s.pt --include engine --device 0量化压缩python export.py --weights yolov5s.pt --include int8 --device 09. 实际应用案例9.1 车牌识别系统基于YOLOv5的车牌检测流程收集车牌数据集并进行标注训练专用检测模型集成OCR模块识别车牌号部署到边缘设备9.2 工业质检系统应用场景缺陷检测产品分类计数统计优势实时性强准确率高适应多种产品10. 进阶发展方向模型轻量化知识蒸馏通道剪枝量化感知训练多任务学习检测分割检测姿态估计检测跟踪领域自适应跨域迁移少样本学习自监督学习在实际项目中我发现YOLOv5的灵活性是其最大优势。通过调整网络结构和训练策略可以很好地适应各种应用场景。特别是在边缘设备部署时模型压缩和加速技术的合理运用可以显著提升系统性能。

Dify开源AI应用平台：从零部署到企业级工作流实战指南

🚀 30款热门AI模型一站整合，DeepSeek/GLM/Qwen 随心用，限时 5 折。 👉 点击领海量免费额度 Dify 是一个开源的 AI 应用开发平台，由 LangGenius 团队打造，核心目标是让开发者、产品经理甚至业务人员都能快…...

2026/7/4 2:35:51 阅读更多 →

Java毕设选题推荐：基于 Java 的高校一卡通权限管理系统的设计与实现校园一卡通食堂消费与水电费管理系统【附源码、mysql、文档、调试+代码讲解+全bao等】

博主介绍：✌️码农一枚 ，专注于大学生项目实战开发、讲解和毕业🚢文撰写修改等。全栈领域优质创作者，博客之星、掘金/华为云/阿里云/InfoQ等平台优质作者、专注于Java、小程序技术领域和毕业项目实战 ✌️技术范围：&am…...

2026/7/4 2:31:25 阅读更多 →

饰品ai模特图生成轻松实现，电商人穿戴展示与图片处理新利器

在电商饰品展示与模特图设计领域，饰品ai模特图生成已经成为商家关注的重点。作为一个深度参与电商图片制作与设计的从业者，我对多个热门AI图片、素材及视频工具进行了详细体验和梳理。作图鸟作图鸟地址：https://www.zuotuniao.com/?from…...

2026/7/4 2:29:59 阅读更多 →

2026云服务器ai部署的实践经验整理

和我们常见的web应用部署比，云服务器ai部署对资源的要求差异很大。普通web应用大多对CPU和内存的需求比较平稳，波动小，对GPU没有特殊要求。但云服务器ai部署不管是推理还是训练，都对异构计算资源、存储IO、内存容量有不一样的要求…...

2026/7/3 0:37:45 阅读更多 →

Unity 最强地形网格系统解析，从网格生成到 A* 寻路的实现原理

在策略游戏（SLG）、战棋（SRPG）、RTS、塔防甚至模拟经营类游戏中，网格（Grid）几乎是所有玩法的基础。无论是《文明》《火焰纹章》《幽浮》《XCOM》，还是大量 RTS 游戏，它们…...

2026/7/4 2:06:57 阅读更多 →

基于汤色与叶底的茶叶品质鉴别方法：技术原理、局限性与系统评估框架

基于汤色与叶底的茶叶品质鉴别方法：技术原理、局限性与系统评估框架在茶叶品质鉴别领域，“看汤色”和“看叶底”常被作为直观判断手段，但能否仅凭这两项指标实现100%的真假与好坏鉴定？本文从技术角度拆解其原理、局限及正确应用方…...

2026/7/3 2:03:26 阅读更多 →

基于数据驱动的多尺度表示的信号去噪统计方法研究附Matlab代码

✅作者简介：热爱科研的Matlab仿真开发者，擅长毕业设计辅导、数学建模、数据处理、算法改进、程序设计科研仿真。🍎完整代码获取定制创新论文复现私信🍊个人信条：做科研，博学之、审问之、慎思之、明辨之、…...

2026/7/2 20:47:10 阅读更多 →

更多精彩文章