摘要本研究针对香梨产业园果实数量统计和产量预测中人工清点效率低、主观性强、难以满足规模化管理需求等问题设计并实现了一套基于深度学习的香梨产量预测系统。系统以香梨图像为研究对象融合目标检测、特征工程与回归分析方法实现了图像检测、视频检测、实时检测及产量预测等功能。数据集简介本数据集为香梨目标检测数据集共包含 2788 张图像和 33296 个标注框涵盖训练集、验证集和测试集可用于香梨果实检测模型的训练与评估。数据集概述本研究围绕香梨产业园果实数量统计与产量预测需求设计并实现了一套基于深度学习的香梨产量预测系统。传统人工清点和经验估产方式存在效率低、主观性强、难以适应大规模果园管理等问题因此有必要引入计算机视觉与机器学习方法提高果实识别与产量估算的自动化和智能化水平。本文以香梨图像为研究对象结合目标检测、特征工程和回归分析构建了一个集图像检测、视频检测、实时检测和产量预测于一体的可视化系统。在方法上系统采用 YOLO12 目标检测模型对香梨果实进行识别与计数并提取果实数量、检测置信度、检测框面积、果实密度、重叠率、空间分布均匀度和估算总重量等特征 。在此基础上构建线性回归、随机森林回归和梯度提升回归等产量预测模型通过性能对比选取最优模型用于产量估算。同时引入基于规则的估算方法作为补充以提高系 统在不同场景下的适用性。系统基于 Python 开发并结合 PyQt 实现图形化界面。实验结果表明该系统能够较为准确地完成香梨目标检测、数量统计和产量预测任务实现从图像输入到结果输出的完整流程。相比传统人工估产方法本文方法在自动化程度、处理效率和结果一致性方面具有一定优势。研究结果表明深度学习与机器学习技术在果园智能管理和农业信息化应用中具有较好的应用价值可为香梨产量预测及相关果树智能监测提供参考。数据集来源本研究所使用的数据集为香梨目标检测数据集图像数据来源于果园场景下香梨果实图像的采集、整理与筛选并在预处理后形成 适用于目标检测任务的数据集。所有图像均采用 YOLO 格式进行边界框标注目标类别定义为香梨pear共计标注 33296 个实例。整个标注过程遵循统一规范以保证数据标注的一致性和准确性为后续 YOLO12 模型训练、性能评估以及系统应用提供了可靠的数据支撑。类别定义标注规范标注采用 YOLO 格式每个目标一行字段为 class x_center y_center width height 坐标均为相对归一化0~1。图1 标注规范图数据规模与划分总图像数2,788张总标注框数33,296个图2 数据集在训练、验证和测试集上的分布数据集按照约 70:20:10 的比例划分为训练集、验证集和测试集图3 数据集划分及用途说明质量控制标注采用双阶段质量控制流程首先进行规范化标注与自检 确保目标框贴合实例外接矩形且类别一致随后进行抽样复核 针对漏标、错标与框位置偏差进行纠正。对争议样本进行二次确认 以提高跨标注者一致性与总体标注可靠性。数据格式与使用数据集采用标准 YOLO 格式组织通过 data.yaml 配置文件即可快速集成到训练流程中。目录结构数据集采用标准 YOLO 格式组织图像和标注文件分别存放在 images/ 和 labels/ 目录下并按训练集、验证集、测试集划分。性能评测基于 YOLO 模型在本数据集上进行训练和评测使用mAP0.5与mAP0.5:0.95等标准指标对模型检测效果进行评估。评测结果如下训练过程综合指标曲线图图3 训练与验证指标随Epoch变化趋势图精确率-召回率PR曲线图图4 目标检测PR曲线Precision-RecallF1分数-置信度阈值曲线图图5 不同置信度阈值下的F1曲线归一化混淆矩阵图分类误判分析图6 归一化混淆矩阵person / leaflet应用案例案例1基于深度学习的香梨产量预测系统设计与实现图7 应用案例基于深度学习的香梨产量预测系统免责声明与引用数据仅用于科研与教学用途。若用于商业场景请自行核验数据许可。 如需引用请在论文或报告中注明数据集名称与版本号。作者信息作者Bob (张家梁)项目编号Datasets-17原创声明本项目为原创作品