【发布时间】:2016-03-24 22:41:16
【问题描述】:
我想知道caffe 中使用的 lmdb 文件是否比包含原始图像的文件大得多是有原因的。请给我一个解释好吗?
【问题讨论】:
标签: caffe computer-vision neural-network deep-learning caffe lmdb
我想知道caffe 中使用的 lmdb 文件是否比包含原始图像的文件大得多是有原因的。请给我一个解释好吗?
【问题讨论】:
标签: caffe computer-vision neural-network deep-learning caffe lmdb
对于这样一个抽象的问题,很难给出具体的答案,但我会试一试:
图像文件通常被压缩:大小为h by w by 3 的.png 或.jpg 由于压缩占用的磁盘空间远少于h*w*3 字节。另一方面,要在神经网络(或任何其他 ML 软件)中处理图像,您需要使用图像的未压缩表示。因此,caffe 使用的lmdb、leveldb、hdf5 数据集以 未压缩 方式存储输入图像,每个像素使用 32 位浮点数(而不是 uint8),因此急剧增加文件大小。
【讨论】:
lmdb 中的压缩图像。如果您使用 caffe 中的 convert_imageset 工具,则可以传递-encode_type=png 或-encode_type=jpg 参数将编码图像保存到lmdb。它会显着减少您的数据库大小,但会在训练/测试阶段花费更多时间来解码图像。