【问题标题】:Open .Parquet Files from AWS S3 in AWS SageMaker(jupyter notebook)在 AWS SageMaker(jupyter notebook)中从 AWS S3 打开 .Parquet 文件
【发布时间】:2019-10-22 14:57:21
【问题描述】:

当我尝试使用 Jupyter Notebook 打开我的 AWS S3 中的 .parquet 文件时,它说 Jupyter 无法打开它并且它给了我一个错误。我想知道它是否不兼容或有解决方法?

【问题讨论】:

    标签: amazon-s3 jupyter-notebook parquet amazon-sagemaker


    【解决方案1】:

    如果您先将它们暂存到本地磁盘会怎样? 例如,如果你想从 jupyter 做所有事情(使用 pyarrow installed

    1 首先,在一个降价单元格中:

    ! aws s3 cp s3://mybucket/file.parquet /home/ec2-user/SageMaker/

    2 然后在同一个笔记本的 python 单元中:

    import pyarrow.parquet as pq
    
    data = pq.read_table('file.parquet').to_pandas()
    

    【讨论】:

      【解决方案2】:

      您能否提供有关此问题的更多信息?您看到什么具体的错误消息?您在笔记本单元格中运行的命令是什么?

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 2020-02-29
        • 1970-01-01
        • 1970-01-01
        • 2019-12-30
        • 2018-06-24
        • 2020-02-12
        • 2019-05-15
        相关资源
        最近更新 更多