用滴滴D²-City数据自制YOLO数据集：手把手教你从抽帧到标注（含斑马线、行人、红绿灯）

张

张建站

2026/5/30 12:16:23

10分钟阅读

用滴滴D²-City数据自制YOLO数据集：手把手教你从抽帧到标注（含斑马线、行人、红绿灯）

从滴滴D²-City到YOLO数据集实战级交通场景数据标注全流程在计算机视觉领域高质量的数据集是目标检测模型性能的基石。滴滴开源的D²-City数据集作为行车记录仪视角的丰富资源为交通场景研究提供了宝贵素材。本文将带你完整走通从原始视频抽帧到多类别标注的实战路径涵盖斑马线、行人、交通灯等关键目标的处理技巧。1. 环境准备与数据源处理工欲善其事必先利其器。开始前需要配置以下环境# 基础环境配置 conda create -n d2city python3.8 conda activate d2city pip install opencv-python numpy tqdm滴滴D²-City数据集包含超过10,000小时的行车记录视频建议优先下载城市道路场景片段。视频文件通常为H.264编码的MP4格式平均码率在8-12Mbps之间。存储规划需注意内容类型空间需求处理耗时参考原始视频(1小时)4-6GB-抽帧图片(30fps)18GB/小时25-40分钟标注文件(TXT)50-100MB/万张依赖标注进度抽帧环节推荐使用OpenCV的VideoCapture模块以下优化版脚本可自动匹配时间戳import cv2 from pathlib import Path def extract_frames(video_path, output_dir, interval30): cap cv2.VideoCapture(str(video_path)) fps cap.get(cv2.CAP_PROP_FPS) frame_interval int(fps * interval) Path(output_dir).mkdir(exist_okTrue) count 0 while cap.isOpened(): ret, frame cap.read() if not ret: break if count % frame_interval 0: cv2.imwrite(f{output_dir}/frame_{count:06d}.jpg, frame) count 1 cap.release()提示实际项目中建议按1-2秒间隔抽帧既能保证数据多样性又避免冗余。夜间低光照片段可单独处理。2. 多类别标注策略设计交通场景标注需要建立清晰的类别体系推荐采用分层标注方案一级类别基础检测行人pedestrian斑马线crosswalk交通灯traffic_light二级类别精细识别交通灯状态红灯red绿灯green黄灯yellow故障灯off标注工具选型对比工具优点缺点适合场景LabelImg图形界面友好仅支持矩形标注快速标注CVAT支持视频标注需要部署服务团队协作Roboflow云端管理有使用限制企业级项目对于斑马线这类不规则目标推荐采用多边形标注而非传统矩形框。YOLOv8等新版框架已支持多边形标注格式能更好捕捉斜向斑马线的几何特征。3. 标注质量管控体系低质量标注会直接影响模型性能建议建立三级质检机制初级校验检查标注文件与图像匹配验证基础格式规范# 检查标注文件完整性 find ./images -name *.jpg | wc -l find ./labels -name *.txt | wc -l中级校验随机抽查标注准确性检查遮挡目标处理一致性高级校验统计分析标注分布可视化锚框分布热力图常见问题处理方案问题类型解决方案示例部分遮挡标注可见部分被树遮挡的行人小目标放大后标注远处的交通灯反光干扰标记为困难样本湿滑路面的反光注意对于交通灯状态标注建议同一帧中不同方向的信号灯分开标注避免状态混淆。4. 数据集优化与增强技巧原始数据往往存在分布不均衡问题可通过以下方法优化数据增强策略天气模拟添加雾效、雨滴光照调整过曝/欠曝模拟透视变换模拟不同视角# 使用albumentations进行增强 import albumentations as A transform A.Compose([ A.RandomBrightnessContrast(p0.5), A.HueSaturationValue(p0.3), A.RandomFog(fog_coef_lower0.1, p0.1) ])困难样本挖掘用初始模型预测验证集筛选低置信度样本针对性补充标注存储目录结构建议dataset/ ├── images/ │ ├── train/ │ └── val/ ├── labels/ │ ├── train/ │ └── val/ └── classes.txt5. 实战中的经验技巧经过多个项目的实践验证这些技巧能显著提升效率批量重命名工具# 统一文件名格式 rename s/^/d2city_/ *.jpg并行标注技巧将数据集按场景类型拆分不同人员标注不同子集最后合并时统一校验自动化校验脚本# 检查标注越界问题 def check_bbox(img_h, img_w, x_center, y_center, width, height): if x_center 0 or x_center 1: return False # 其他维度检查... return True标签格式转换YOLO格式与其他格式的转换是常见需求这个字典能快速定位关键字段format_map { yolo: [class_id, x_center, y_center, width, height], coco: [category_id, bbox, area], pascal: [xmin, ymin, xmax, ymax] }在最近一个城市道路监控项目中采用这套方法后标注效率提升了40%最终训练出的YOLOv8模型在交通灯状态识别上达到92.3%的准确率。特别是对斜向斑马线的检测采用多边形标注后IOU提升了15个百分点。

浏览器Cookie本地导出：Get cookies.txt LOCALLY终极隐私保护方案

浏览器Cookie本地导出：Get cookies.txt LOCALLY终极隐私保护方案【免费下载链接】Get-cookies.txt-LOCALLY Get cookies.txt, NEVER send information outside. 项目地址: https://gitcode.com/gh_mirrors/ge/Get-cookies.txt-LOCALLY 在当今数字时代&#…...

2026/5/30 12:16:05 阅读更多 →

Xsens如何融入机器人控制、训练工作流？

在人形机器人快速发展的今天，机器人“会不会动”已经不再是核心问题，真正的挑战是：机器人能否像人一样稳定、自然、精准地完成复杂动作。无论是双臂协同操作、工业搬运，还是灵巧抓取与步态切换，高质量运动数据正在成为…...

2026/5/30 12:12:11 阅读更多 →

电路设计入门：从欧姆定律到PCB实战，手把手教你制作数字温度计

1. 项目概述：从理论到实物的桥梁电路设计，听起来像是电子工程师在实验室里对着复杂公式和仿真软件埋头苦干的专属领域。但事实上，它离我们每个人的生活都无比接近。你手里正在滑动的手机、家里自动调节温度的空调、甚至孩子玩具里一闪一闪的…...

2026/5/30 12:12:03 阅读更多 →

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…...

2026/5/26 6:08:07 阅读更多 →

通过curl命令调试Taotoken大模型API，快速排查接入问题

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度通过curl命令调试Taotoken大模型API，快速排查接入问题在接入大模型服务时，直接使用HTTP请求进行调试是一种…...

2026/5/29 11:21:15 阅读更多 →

Kubernetes自定义资源：扩展Kubernetes API的能力

Kubernetes自定义资源：扩展Kubernetes API的能力一、Kubernetes自定义资源概述 1.1 自定义资源的定义 Kubernetes自定义资源（Custom Resource，CR）是指用户自定义的资源类型，它扩展了Kubernetes API，允许用…...

2026/5/30 9:36:03 阅读更多 →

Codeforces Round 1057

【打得太糖了】Codeforces Round 1057 (Div. 2) solve 3 题 https://www.bilibili.com/video/BV1Gi4nzYE66/ 【Codeforces Round 1057 (Div. 2)实况】好久没打cf了，只会A-D https://www.bilibili.com/video/BV12q4xzMEy5/ 憧憬成为 Master 第 29 集 —— 反向冲分 (…...

2026/5/27 10:36:27 阅读更多 →