YOLO11实战教程从图片检测到视频分析一步步教你用1. 环境准备与快速部署1.1 镜像获取与启动YOLO11镜像提供了完整的计算机视觉开发环境包含预装好的YOLO11算法和相关依赖。你可以通过以下两种方式使用这个镜像Jupyter Notebook方式启动后访问Jupyter Lab界面可以直接在浏览器中编写和运行Python代码支持可视化展示检测结果SSH方式通过SSH连接到容器环境适合习惯命令行操作的用户可以运行长时间训练任务1.2 项目目录结构进入项目主目录是使用YOLO11的第一步cd ultralytics-8.3.9/这个目录包含train.py模型训练脚本predict.py推理预测脚本models/预训练模型存放位置datasets/数据集存放位置2. 图片检测基础教程2.1 单张图片检测最简单的使用方式是检测单张图片中的物体。以下是一个完整示例from ultralytics import YOLO # 加载预训练模型 model YOLO(yolo11m.pt) # 运行推理 results model.predict(bus.jpg, showTrue, saveTrue)这段代码会加载中等大小的YOLO11模型(yolo11m.pt)对bus.jpg图片进行物体检测在窗口中显示检测结果(showTrue)保存带标注的结果图片(saveTrue)2.2 关键参数解析YOLO11提供了丰富的推理参数以下是几个最常用的参数名类型默认值说明conffloat0.25置信度阈值过滤低置信度检测ioufloat0.7非极大值抑制的IoU阈值imgszint/tuple640输入图像尺寸devicestrNone指定运行设备(cpu/cuda)classeslistNone只检测指定类别的物体例如只检测行人和汽车model.predict(street.jpg, classes[0, 2]) # 0行人, 2汽车3. 视频分析进阶应用3.1 基础视频处理YOLO11可以处理视频文件逐帧进行分析# 处理视频文件 model.predict(traffic.mp4, saveTrue, imgsz1280, conf0.5)这段代码会读取traffic.mp4视频文件使用1280x1280分辨率处理只保留置信度0.5的检测结果生成带标注框的输出视频3.2 实时视频流处理YOLO11还支持实时摄像头输入# 处理摄像头实时流 model.predict(source0, # 0表示默认摄像头 showTrue, streamTrue) # 启用流模式减少延迟关键视频参数vid_stride跳帧处理加快分析速度stream_buffer缓冲帧处理避免丢帧save_frames保存处理后的单帧图片4. 训练自定义模型4.1 准备数据集YOLO11使用标准YOLO格式数据集目录结构如下datasets/ custom/ train/ images/ # 训练图片 labels/ # 对应标注文件 val/ images/ # 验证图片 labels/ # 对应标注文件标注文件为.txt格式每行表示一个物体class_id x_center y_center width height4.2 启动训练使用train.py脚本开始训练python train.py --data custom.yaml --cfg yolov11m.yaml --weights --batch 16 --epochs 100关键训练参数--data数据集配置文件路径--cfg模型配置文件--weights预训练权重(空表示从零开始)--batch批量大小--epochs训练轮数4.3 训练监控训练过程中会输出如下信息损失函数变化验证集mAP指标当前训练进度训练完成后会在runs/train/目录生成训练好的模型(weights/best.pt)训练过程可视化图表验证集测试结果5. 实用技巧与常见问题5.1 性能优化建议推理速度优化使用更小的模型(yolo11n/yolo11s)减小输入图像尺寸(imgsz320)启用半精度推理(halfTrue)检测精度提升增大输入图像尺寸(imgsz1280)降低置信度阈值(conf0.1)启用测试时增强(augmentTrue)5.2 常见问题解决问题1检测结果不准确解决方案调整conf和iou参数检查训练数据标注质量问题2GPU内存不足解决方案减小batch size降低图像尺寸问题3视频处理卡顿解决方案设置vid_stride2跳过部分帧启用streamTrue6. 总结通过本教程你已经掌握了YOLO11的核心使用方法基础图片检测学会使用predict()函数进行物体检测视频分析掌握视频文件和实时流的处理方法模型训练了解如何训练自定义数据集性能调优学会根据需求调整各种参数YOLO11是一个功能强大且灵活的计算机视觉工具通过合理调整参数可以满足从简单物体检测到复杂视频分析的各种需求。获取更多AI镜像想探索更多AI镜像和应用场景访问 CSDN星图镜像广场提供丰富的预置镜像覆盖大模型推理、图像生成、视频生成、模型微调等多个领域支持一键部署。