【问题标题】:The training labels in kitti datasetkitti 数据集中的训练标签
【发布时间】:2018-07-19 10:22:47
【问题描述】:
我想知道 kitti 训练标签中每个对象的 14 个值是什么。当我在 matlab 中标记对象时,我得到每个对象的 4 个值,即(x、y、宽度、高度)。
两者有什么区别?
【问题讨论】:
-
如果您在 Google 上搜索“kitti 训练标签”,第一个结果是 GitHub 问题,其中包含链接文档,其中列出了所有带有描述的属性:here。
-
标签:
python
matlab
computer-vision
training-data
point-clouds
【解决方案1】:
帧样本在序列中的位置
track id序列内对象的跟踪ID
type 对象类型:“汽车”、“行人”、“自行车”、“电车”、
“Person_sitting”、“Misc”或“DontCare”
截断表示截断级别的整数 (0,1,2)。
遮挡表示遮挡状态的整数 (0,1,2,3)。
alpha 物体观察角度,测距[-Pi; π]
bbox 2D(从 0 开始)对象的边界框:
左、上、右、下图像坐标
尺寸 3D 物体尺寸:高、宽、长 [m]
location 3D 对象位置 x,y,z 以相机坐标表示。 [米]
rotation_y 以相机坐标绕 Y 轴旋转。 [-π; π]
在您的情况下,您获得的四个标签是
bbox 2D KITTI groundtruth 的标签