【发布时间】:2021-11-29 08:19:31
【问题描述】:
我在位于以下链接的 Amazon Simple Storage Service 上有一个 1.5 TB 大小的 hdf5 文件。我没有磁盘空间来保存它,也没有内存来读取它。因此,我想按块读取它,处理它,然后丢弃读取的部分。我希望使用 pandas 的 read_hdf 来阅读它,但它不支持 url。 h5py 库似乎也没有。虽然它确实提到了ros3 驱动程序,但我还不能让它工作。我也尝试了对这个问题的回答,但是 h5py 无法读取这些块,或者我还没有找到方法。所以我对如何处理这个文件一无所知。有谁知道该怎么做?该文件的链接是这样的:
【问题讨论】:
标签: python-3.x pandas amazon-s3 hdf5