【发布时间】:2019-01-26 15:26:49
【问题描述】:
我在我的桌面应用程序中使用 HDF5 文件系统。我对文件中的所有数据集都使用了 GZIP 5 级压缩。
但仍然当我使用 7zip 压缩 HDF5 文件时,文件大小变得更小了大约一半到三分之一!!!
我正在遵循的过程是:
- 生成 HDF5 文件。
- 在文件中导入数据。
- 使用 h5repack 实用程序释放未计入的空间(如果有)。
- 我使用 7zip 将文件压缩为 .zip
这怎么可能?
更多压缩的范围在哪里?
如何生成更小的 HDF5 文件?关于使用属性(H5P)的任何建议。
我认为 7zip 可能会使用 GZIP 级别 9 无情地压缩我的文件,但我尝试在我的 HDF5 文件中使用 GZIP 级别 9。新文件大小仍然是原来的一半。
【问题讨论】:
-
每个数据块,都是自己压缩的。所以第一个问题是,你的块大小/形状是什么?你确实使用洗牌吗? (否则压缩比会差很多)
-
是的,我在压缩之前使用随机播放。我每个数据集存储 10k 个点,并且我使用 5k 的块大小。
标签: compression hdf5 h5py pytables hdf