【发布时间】:2017-01-29 10:49:04
【问题描述】:
(Python 3.5) 我正在尝试将大型用户 review.json 文件(1.3gb)解析为 python 并转换为 .csv 文件。我尝试在网上寻找一个简单的转换器工具,其中大多数都接受最大 1Mb 的文件大小或者非常昂贵。 因为我对 python 还很陌生,所以我想我会问 2 个问题。
这样做是否可能/有效,还是我应该寻找另一种方法?
我尝试了以下代码,它只是在我的 .json 文档中读取和写入前 342 行,然后返回错误。
块引用 文件“C:\Anaconda3\lib\json__init__.py”,第 319 行,加载中 返回_default_decoder.decode(s)
文件“C:\Anaconda3\lib\json\decoder.py”,第 342 行,在解码中 raise JSONDecodeError("额外数据", s, end) JSONDecodeError: 额外数据
这是我正在使用的代码
import csv
import json
infile = open("myfile.json","r")
outfile = open ("myfile.csv","w")
writer = csv.writer(outfile)
for row in json.loads(infile.read()):
writer.writerow(row)
我的 .json 示例:
链接到Json的一小部分
我的想法是它与我的 for 循环相关的某种类型的错误,与 json.loads...但我对此知之甚少。是否可以创建字典{} 并仅转换值“user_id”、“stars”、“text”?还是我在做梦。
感谢任何建议或批评。
【问题讨论】:
标签: python json csv dictionary