【发布时间】:2017-10-27 23:12:09
【问题描述】:
我正在尝试创建一辆自动遥控车,我的 Python 程序应该在给定的时间间隔内查询实时流并将其添加到训练数据集中。我要收集的数据是来自 OpenCV 的当前图像数组以及汽车的当前速度和角度。然后我希望将其加载到 Keras 中进行处理。
我发现numpy.save() 只是将一个数组保存到一个文件中。为我的需要保存数据的最佳/最有效方式是什么?
【问题讨论】:
-
使用数据库(有很多选择)或者 HDF5。 Numpy 可以存储多个数组(我认为它称为 savez),但实时更新并不是它的目的(HDF5 也可能受到限制)。
-
如果我使用 HDF5,我可以将新信息附加到数据集,还是将其全部加载到内存中并一次性保存?
-
Extendible Dataset。是的,它可能会起作用,而且可能不如 DB 起作用,它也是常见的 keras 输入之一,但我真的认为 DB 方法更强大(而且我相信 HDF5 的方式比 DB 少)。