【发布时间】:2019-03-22 20:34:33
【问题描述】:
我有一个很大的 json 文件。它的日志数据,我已将其压缩为 bz2 格式(myfile.json.bz2)。 bz2 文件的大小为 90MB。我搜索了一个很好的解决方案或博客文章来解释有效地解析压缩的 bz2 json 文件,但找不到任何内容。
由于文件很大,所以做类似的事情是不可能的。
with open('data.json') as data_file:
data = json.load(data_file)
最好的方法是什么?
经过一番挖掘,我发现有一个 python 包可以读取 bz2
input_file = bz2.BZ2File(filename, 'r')
【问题讨论】:
-
因为
BZ2File有一个read方法可以返回任意数量的字节,我可能会考虑尝试将json 作为流读取,例如pypi.python.org/pypi/ijson