【发布时间】:2021-07-30 21:20:58
【问题描述】:
向编码员和 Google 云开发人员和专业人士致敬。 我正在尝试使用 pandas 提供的内置方法“pd.read_hdf()”从谷歌云存储中读取 hdf 文件列表,其中文件名是这样的(“client1.h”)。 我的问题是我总是收到这个错误:
NotImplementedError: Support for generic buffers has not been implemented.
在不同的论坛和网站深入搜索后,我发现很多人都遇到了同样的问题,但没有提供解决方案。
我使用的代码如下:
from google.cloud.storage import blob, bucket
import pandas as pd
from google.cloud import storage
storage_client = storage.Client.from_service_account_json('file___.json')
bucket = storage_client.get_bucket('my_bucket_name')
blob = bucket.blob("data1.h")
df = pd.read_hdf(blob, mode='r+')
print(df)
我也尝试了下面的代码,但我得到了同样的错误:
blob = bucket.blob("data1.h")
data = download_as_string() #as_bytes as_text
df = pd.read_hdf(io.BytesIO(data), mode='r+')
当我将文件下载到本地环境并使用它的路径读取它时,它运行良好并且没有问题,但不幸的是,在云存储中我有大量文件,所以我无法将它们全部下载到一起工作。
!!!请 !!谁有解决方案或建议,我请他分享。
【问题讨论】:
标签: python pandas google-cloud-storage hdf5 hdf