【发布时间】:2019-10-22 14:57:21
【问题描述】:
当我尝试使用 Jupyter Notebook 打开我的 AWS S3 中的 .parquet 文件时,它说 Jupyter 无法打开它并且它给了我一个错误。我想知道它是否不兼容或有解决方法?
【问题讨论】:
标签: amazon-s3 jupyter-notebook parquet amazon-sagemaker
当我尝试使用 Jupyter Notebook 打开我的 AWS S3 中的 .parquet 文件时,它说 Jupyter 无法打开它并且它给了我一个错误。我想知道它是否不兼容或有解决方法?
【问题讨论】:
标签: amazon-s3 jupyter-notebook parquet amazon-sagemaker
如果您先将它们暂存到本地磁盘会怎样?
例如,如果你想从 jupyter 做所有事情(使用 pyarrow installed)
1 首先,在一个降价单元格中:
! aws s3 cp s3://mybucket/file.parquet /home/ec2-user/SageMaker/
2 然后在同一个笔记本的 python 单元中:
import pyarrow.parquet as pq
data = pq.read_table('file.parquet').to_pandas()
【讨论】:
您能否提供有关此问题的更多信息?您看到什么具体的错误消息?您在笔记本单元格中运行的命令是什么?
【讨论】: