【发布时间】:2010-10-01 15:54:23
【问题描述】:
我想以编程方式更改与 HDF5 文件中的数据集关联的数据。我似乎找不到按名称删除数据集(允许我用修改后的数据再次添加它)或按名称更新数据集的方法。我正在使用 HDF5 1.6.x 的 C API,但指向任何 HDF5 API 的指针都会很有用。
【问题讨论】:
我想以编程方式更改与 HDF5 文件中的数据集关联的数据。我似乎找不到按名称删除数据集(允许我用修改后的数据再次添加它)或按名称更新数据集的方法。我正在使用 HDF5 1.6.x 的 C API,但指向任何 HDF5 API 的指针都会很有用。
【问题讨论】:
HDF5 目前不提供从文件中删除数据集或回收已删除对象占用的存储空间的简单机制。
如此简单的删除似乎是不可能的。但该部分仍在继续:
可以使用
H5Ldelete函数和h5repack实用程序来删除数据集并回收它使用的空间。使用H5Ldelete函数,可以从文件结构中删除指向数据集的链接。删除所有链接后,任何应用程序都无法访问该数据集,并有效地从文件中删除。恢复未链接数据集占用空间的方法是将文件的所有对象写入新文件。应用程序无法访问任何未链接的对象,并且不会包含在新文件中。可以使用自定义程序或h5repack实用程序将对象写入新文件。
【讨论】:
H5Ldelete 后确实缩小了。这是有意为之还是偶然,我不知道。
如果你想在 C++ 中删除一个数据集,你需要以下命令:
H5File m_h5File (pathAndNameToHDF5File, H5F_ACC_RDWR); //The hdf5 c++ object.
std::string channelName = "/myGroup/myDataset";
int result = H5Ldelete(m_h5File.getId(), channelName.data(), H5P_DEFAULT);
如果成功,结果将是一个非负值;否则返回负值。 https://support.hdfgroup.org/HDF5/doc/RM/RM_H5L.html#Link-Delete
正如@MaxLybbert 所说,它没有恢复的硬盘空间。您必须使用重新打包工具。 但是,使用 HDF5 v.1.10 可以恢复空间。但是用户指南还没有准备好:https://support.hdfgroup.org/HDF5/docNewFeatures/NewFeaturesFileSpaceMgmtDocs.html
【讨论】: