【发布时间】:2019-11-11 17:23:36
【问题描述】:
我需要用 Python 以一种简单的方式来完成它。我正在尝试使用 Pandas,但我才刚刚开始,这对我来说非常困难。
现在我正在尝试使用 json2parquet:
try:
input_filename= '/tmp/source_file'
source_file = s3.get_object(Bucket="myBucket", Key="myJsonLinesFile")
datajson = source_file['Body'].read()
with open(input_filename, 'wb') as f:
f.write(datajson)
convert_json(input_filename, '/tmp/final.parquet')
except Exception as e:
print(e)
raise e
但我遇到以下错误: "errorMessage": "不能混合列表和非列表、非空值", "errorType": "ArrowInvalid",
【问题讨论】:
标签: python json pandas parquet