【发布时间】:2019-08-04 10:57:50
【问题描述】:
我现在正在为这件事头疼。我是这个 parquet 文件的新手,我遇到了很多问题。
每次我尝试从中创建df 时,都会抛出一个错误,显示为OSError: Passed non-file path: \datasets\proj\train\train.parquet。
我试过这个:
pq.read_pandas(r'E:\datasets\proj\train\train.parquet').to_pandas()
和
od = pd.read_parquet(r'E:\datasets\proj\train\train.parquet', engine='pyarrow')
我还更改了数据集所在驱动器的驱动器号,它是一样的!
所有引擎都一样。
请帮忙!
【问题讨论】:
-
你在哪个操作系统上?
-
Window 2019 服务器。
-
你试过
import os;os.path.exists(x)其中 x 是您要加载的文件? -
没有。我没试过。让我这样做。我不在电脑自动取款机前,所以需要一段时间才能完成。
标签: python pandas parquet pyarrow fastparquet