【发布时间】:2020-08-31 15:09:18
【问题描述】:
s3_obj = s3.Object(s3_bucket, file_prefix)
df= pd.read_json(jsonlines_doc,lines=True)
location=s3_obj.put(Body=json.dumps(jsonlines_doc))
df.to_parquet(location, engine='auto', compression='snappy', index=None)
代码不起作用,但可以将其保存在本地导入的 pyarrow 和 parquet
【问题讨论】:
-
错误在哪里?您可能想查看 BytesIO()。您需要写入内存或流而不是本地文件位置。
-
无法在 S3 中写入
-
我们可以将s3中的jsonfile写入parquet吗?用胶水试过了,还是没有运气
-
请找到错误::errorMessage": "无效的文件路径或缓冲区对象类型:
", "errorType": "ValueError", "stackTrace": [ [ "/ var/task/lambda_function.py", 80, "lambda_handler", "df.to_parquet(location, engine='auto', compression='snappy', index=None)" -
下次请在您的问题中包含错误信息,以便人们可以更轻松地帮助您。
标签: python amazon-web-services amazon-s3 aws-lambda parquet