【发布时间】:2014-01-22 13:51:32
【问题描述】:
我有一个大数据框(126041 个观测值,共 604 个变量)。我是 HDF5 格式的新手。我保存HDF5文件如下:
writeH5DataFrame(myData,"C:/myDir/myHDF5.h5",overwrite=T)
我怎样才能读回数据帧?似乎没有任何
readH5DataFrame或loadH5DataFrame函数?另外,
writeH5DataFrame需要非常长的时间,这可能是因为有大量的列(在这种情况下为 604)。文档提到“每列的数据都存储在单独的 H5Dataset 中。” - 不确定这是否是花费很长时间的原因。有什么方法可以加快编写 HDF5 格式的 DataFrame 的速度吗?
【问题讨论】:
-
不是每个 HDF5 文件都可以在 R 中打开。 你不是在使用 MODIS 数据集吗? MODIS 数据集中的 HDF5 不能直接在 R 中打开(我不确定是因为格式还是正弦投影),你必须使用一些外部工具来处理这些文件。请参阅 MODIS HDF5 spatial data tutorial。
-
不,我没有使用 MODIS 数据集。