【发布时间】:2020-03-05 07:44:34
【问题描述】:
我正在使用 pyarrow(0.12.1) 从 s3 读取镶木地板对象
这是我正在使用的代码:
s3 = s3fs.S3FileSystem()
base_pya_dataset = ParquetDataset('s3://bucket1/source/schema/table_name/2019_10_31_19_59_16', filesystem=s3)
尝试创建 ParquetDataset 时出现以下错误:
"errorMessage": "Corrupted file, smaller than file footer",
"errorType": "ArrowIOError",
我做错了什么?让我非常困惑的是我之前(昨天)有这个工作。除了我正在使用的镶木地板文件之外,我所能发现的一切都没有改变。 parquet 文件必须是某种类型吗?
我已经尝试过: - 添加尾部正斜杠
当我向它提供一个文件的路径时,它可以工作。显然,它试图从我提供的目录中获取文件的方式有问题。
【问题讨论】:
标签: python-3.x pyarrow