【发布时间】:2020-01-14 19:41:26
【问题描述】:
我正在尝试构建一个 CV 模型来检测视频中的对象。我有大约 6 个视频,其中包含训练模型所需的内容。这些是我试图检测的车道、其他车辆等。
我很好奇用于训练模型的数据集的格式。我可以让每个视频的每一帧都变成图像,并创建一个大型图像存储库来训练,或者我可以直接使用这些视频。你认为哪种方式更好?
如果这不是直接的编程问题,我深表歉意。我正在尝试收集我的数据,但我无法下定决心。
【问题讨论】:
-
如果您打算使用
tensorflow,那么您可以使用tf.data.Dataset将这些视频预处理并存储为TFRecordDataset结构。这可能需要更多的工作,但在tf中更容易操作。 This 是关于 SO 预处理视频的一个答案。
标签: deep-learning computer-vision