目标检测论文总结

张

张建站

2026/5/28 4:49:00

10分钟阅读

PointNet: Deep Learning on Point Sets for 3D Classification and Segmentation直接提取点云的点特征提取后使用maxpool得到全局特征然后将点的特征与全局特征进行连接然后再进行进一步处理。其中T-Net的结构这篇博文有介绍。VoxelNet: End-to-End Learning for Point Cloud Based 3D Object Detection这篇文博客写的很不错。采用随机从体素中采样点以进一步提取体素特征然后使用maxpool得到体素局部特征使用局部特征与点特征连接然后在进行进一步处理最后再次使用maxpool得到体素特征。得到最终的特征后使用区域建议网络生成分类结果和预测框。该文章中的正负样本指的是负样本预测框和所有的真实框iou都小于0.45正样本预测框和某个真实框iou大于0.6对于预测框与真实框最大iou值大于等于0.45小于等于0.6的定义为不关注样本即不计算任何分类损失。其中p i p o s p^{pos}_ipipos和p i n e g p^{neg}_ipineg分别表示正样本a i p o s a^{pos}_iaipos和负样本a i n e g a^{neg}_iaineg的Softmax输出u i , u i ∗ u_i,u^*_iui,ui∗分别表示神经网络的正样本输出的标注框和真实标注框。损失函数的前两项表示对于正样本输出和负样本输出的分类损失已经进行了正规化, 其中L c l s L_{cls}Lcls表示交叉熵α \alphaα和β \betaβ是两个常数它们作为权重来平衡正负样本损失对于最后的损失函数的影响。L r e g L_{reg}Lreg表示回归损失这里采用的是Smooth L1函数。PointPillars: Fast Encoders for Object Detection from Point Clouds该方法是在点云空间中长体素柱将点云空间直接降维到二维。简单来说如果点云的范围是限定为[ x m i n , y m i n , z m i n , x m a x , y m a x , z m a x ] [x_{min},y_{min},z_{min},x_{max},y_{max},z_{max}][xmin,ymin,zmin,xmax,ymax,zmax]那么在PointPillars中使用的体素的高度为z m a x − z m i n z_{max}-z_{min}zmax−zmin。需要注意的是PointPillars同样通过限制体素中点云的最小个数与体素的最大数目来对最终的体素数目进行限制。具体网络结构可以参考这博文

前端工程师的云端进化：从浏览器到边缘计算的范式转移

1. 从浏览器到云端：前端工程师的范式转移干了这么多年前端，从 jQuery 时代一路摸爬滚打到 React、Vue 全家桶，我一度以为自己的核心战场就是那方寸之间的浏览器窗口。状态管理、组件生命周期、CSS-in-JS、虚拟 DOM 调优……这些曾是衡量一个…...

2026/5/28 4:47:00 阅读更多 →

ppf-contact-solver在vast.ai上的部署：低成本GPU租赁方案终极指南

ppf-contact-solver在vast.ai上的部署：低成本GPU租赁方案终极指南【免费下载链接】ppf-contact-solver A contact solver for physics-based simulations involving 👚 shells, 🪵 solids and 🪢 rods. 项目地址: https://gitc…...

2026/5/28 4:45:02 阅读更多 →

Gemma-ko-v01未来路线图：即将推出的5大功能，提前了解新特性

Gemma-ko-v01未来路线图：即将推出的5大功能，提前了解新特性【免费下载链接】gemma-ko-v01 项目地址: https://ai.gitcode.com/hf_mirrors/SY_AICC/gemma-ko-v01 Gemma-ko-v01作为备受关注的韩语AI模型，其开发团队正积极推进多项重要…...

2026/5/28 4:45:00 阅读更多 →

Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表·行业首曝）

更多请点击： https://kaifayun.com 第一章：Midjourney渐变美学的神经渲染原理（附RGB-HSV-LCH三空间渐变映射对照表行业首曝） Midjourney 的渐变美学并非传统插值实现，而是由其隐式神经渲染器（Implicit Neu…...

2026/5/26 6:08:07 阅读更多 →

通过curl命令调试Taotoken大模型API，快速排查接入问题

🚀 告别海外账号与网络限制！稳定直连全球优质大模型，限时半价接入中。 👉 点击领取海量免费额度通过curl命令调试Taotoken大模型API，快速排查接入问题在接入大模型服务时，直接使用HTTP请求进行调试是一种…...

2026/5/26 6:15:52 阅读更多 →

Kubernetes自定义资源：扩展Kubernetes API的能力

Kubernetes自定义资源：扩展Kubernetes API的能力一、Kubernetes自定义资源概述 1.1 自定义资源的定义 Kubernetes自定义资源（Custom Resource，CR）是指用户自定义的资源类型，它扩展了Kubernetes API，允许用…...

2026/5/27 21:40:10 阅读更多 →

Codeforces Round 1057

【打得太糖了】Codeforces Round 1057 (Div. 2) solve 3 题 https://www.bilibili.com/video/BV1Gi4nzYE66/ 【Codeforces Round 1057 (Div. 2)实况】好久没打cf了，只会A-D https://www.bilibili.com/video/BV12q4xzMEy5/ 憧憬成为 Master 第 29 集 —— 反向冲分 (…...

2026/5/27 10:36:27 阅读更多 →