【发布时间】:2018-02-01 11:32:29
【问题描述】:
我想使用 hdfs.read() 来获取一个 xxx.h5 文件,但我只是得到一些随机代码,python 如何读取 HDFS 中的 h5 文件?这是我的代码:
from hdfs import *
import pandas as pd
import h5py
c = Client("http://192.168.1.81:50070")
with c.read('/stocks/test/pred/20140103/000001.h5') as reader:
for line in reader:
print(line)
如何读取 hdfs 中的 xxx.h5 文件?非常感谢!
【问题讨论】:
-
我真正的问题是 h5py 如何从内存中读取二进制 h5 文件?因为我从内存中的hadoop读取h5文件,而h5py必须打开文件。这里有一个绕过磁盘IO的方法,很好,谢谢! [这就是答案][1] [1]:stackoverflow.com/questions/11588630/…
-
也许您在混淆 HDFS(Hadoop 分布式文件系统)和 HDF5(分层分布式格式版本 5)。它们是完全不同的东西。