YOLO11实战教程：从图片检测到视频分析，一步步教你用

张

张建站

2026/5/12 16:30:02

10分钟阅读

YOLO11实战教程从图片检测到视频分析一步步教你用1. 环境准备与快速部署1.1 镜像获取与启动YOLO11镜像提供了完整的计算机视觉开发环境包含预装好的YOLO11算法和相关依赖。你可以通过以下两种方式使用这个镜像Jupyter Notebook方式启动后访问Jupyter Lab界面可以直接在浏览器中编写和运行Python代码支持可视化展示检测结果SSH方式通过SSH连接到容器环境适合习惯命令行操作的用户可以运行长时间训练任务1.2 项目目录结构进入项目主目录是使用YOLO11的第一步cd ultralytics-8.3.9/这个目录包含train.py模型训练脚本predict.py推理预测脚本models/预训练模型存放位置datasets/数据集存放位置2. 图片检测基础教程2.1 单张图片检测最简单的使用方式是检测单张图片中的物体。以下是一个完整示例from ultralytics import YOLO # 加载预训练模型 model YOLO(yolo11m.pt) # 运行推理 results model.predict(bus.jpg, showTrue, saveTrue)这段代码会加载中等大小的YOLO11模型(yolo11m.pt)对bus.jpg图片进行物体检测在窗口中显示检测结果(showTrue)保存带标注的结果图片(saveTrue)2.2 关键参数解析YOLO11提供了丰富的推理参数以下是几个最常用的参数名类型默认值说明conffloat0.25置信度阈值过滤低置信度检测ioufloat0.7非极大值抑制的IoU阈值imgszint/tuple640输入图像尺寸devicestrNone指定运行设备(cpu/cuda)classeslistNone只检测指定类别的物体例如只检测行人和汽车model.predict(street.jpg, classes[0, 2]) # 0行人, 2汽车3. 视频分析进阶应用3.1 基础视频处理YOLO11可以处理视频文件逐帧进行分析# 处理视频文件 model.predict(traffic.mp4, saveTrue, imgsz1280, conf0.5)这段代码会读取traffic.mp4视频文件使用1280x1280分辨率处理只保留置信度0.5的检测结果生成带标注框的输出视频3.2 实时视频流处理YOLO11还支持实时摄像头输入# 处理摄像头实时流 model.predict(source0, # 0表示默认摄像头 showTrue, streamTrue) # 启用流模式减少延迟关键视频参数vid_stride跳帧处理加快分析速度stream_buffer缓冲帧处理避免丢帧save_frames保存处理后的单帧图片4. 训练自定义模型4.1 准备数据集YOLO11使用标准YOLO格式数据集目录结构如下datasets/ custom/ train/ images/ # 训练图片 labels/ # 对应标注文件 val/ images/ # 验证图片 labels/ # 对应标注文件标注文件为.txt格式每行表示一个物体class_id x_center y_center width height4.2 启动训练使用train.py脚本开始训练python train.py --data custom.yaml --cfg yolov11m.yaml --weights --batch 16 --epochs 100关键训练参数--data数据集配置文件路径--cfg模型配置文件--weights预训练权重(空表示从零开始)--batch批量大小--epochs训练轮数4.3 训练监控训练过程中会输出如下信息损失函数变化验证集mAP指标当前训练进度训练完成后会在runs/train/目录生成训练好的模型(weights/best.pt)训练过程可视化图表验证集测试结果5. 实用技巧与常见问题5.1 性能优化建议推理速度优化使用更小的模型(yolo11n/yolo11s)减小输入图像尺寸(imgsz320)启用半精度推理(halfTrue)检测精度提升增大输入图像尺寸(imgsz1280)降低置信度阈值(conf0.1)启用测试时增强(augmentTrue)5.2 常见问题解决问题1检测结果不准确解决方案调整conf和iou参数检查训练数据标注质量问题2GPU内存不足解决方案减小batch size降低图像尺寸问题3视频处理卡顿解决方案设置vid_stride2跳过部分帧启用streamTrue6. 总结通过本教程你已经掌握了YOLO11的核心使用方法基础图片检测学会使用predict()函数进行物体检测视频分析掌握视频文件和实时流的处理方法模型训练了解如何训练自定义数据集性能调优学会根据需求调整各种参数YOLO11是一个功能强大且灵活的计算机视觉工具通过合理调整参数可以满足从简单物体检测到复杂视频分析的各种需求。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。

国产数据库新选择：SpringBoot集成KingbaseES的性能优化全攻略

SpringBoot集成KingbaseES性能调优实战指南当企业级应用遇到国产数据库新贵KingbaseES，性能优化便成为开发者最关心的核心议题。作为一款兼容PostgreSQL协议的高性能国产数据库，KingbaseES在金融、政务等关键领域展现出越来越强的竞争力。但要让SpringB…...

2026/5/12 16:30:02 阅读更多 →

VitePress 博客主题定制与美化实战

1. VitePress主题美化的核心思路很多开发者在使用VitePress搭建博客时，都会遇到一个共同的问题：默认主题虽然简洁，但缺乏个性。我在实际项目中发现，通过CSS变量覆盖、自定义组件和插件扩展这三个维度，可以打造出极具辨…...

2026/5/12 16:30:03 阅读更多 →

Navicat密码忘了怎么办？手把手教你用Python解密找回（附详细步骤）

Navicat密码恢复实战：Python解密技术全解析你是否曾经因为忘记Navicat保存的数据库密码而手足无措？作为开发者或数据库管理员，这种情况可能会让你陷入困境——重要数据近在咫尺却无法访问。本文将带你深入理解Navicat的密码加密机制&#xf…...

2026/5/12 16:30:05 阅读更多 →

2026年AI大模型API中转平台排名揭晓，诗云API(ShiyunApi)脱颖而出成省心之选

在AI开发领域，如何接入模型厂商的官方API是一个绕不开的现实问题。对于海外开发者来说，注册、绑卡、调用，三步即可轻松搞定。然而，国内开发者却面临着跨境网络波动、外币支付门槛、发票合规需求以及多厂商Key碎片化管理等诸多“非…...

2026/5/12 13:39:41 阅读更多 →

CANN/catlass TLA张量详解

TLA Tensors 【免费下载链接】catlass 本项目是CANN的算子模板库，提供NPU上高性能矩阵乘及其相关融合类算子模板样例。项目地址: https://gitcode.com/cann/catlass 本文介绍 TLA 中的 Tensor。如果说 Layout 负责描述“逻辑坐标如何映射到内存”&#xf…...

2026/5/12 8:30:03 阅读更多 →

LinkSwift：解锁九大网盘高速下载的终极浏览器脚本解决方案

LinkSwift：解锁九大网盘高速下载的终极浏览器脚本解决方案【免费下载链接】Online-disk-direct-link-download-assistant 一个基于 JavaScript 的网盘文件下载地址获取工具。基于【网盘直链下载助手】修改 ，支持百度网盘 / 阿里云盘 / 中国移动云盘 / …...

2026/5/11 23:43:42 阅读更多 →