【发布时间】:2014-05-07 22:52:00
【问题描述】:
我在格式化和编码使用我编写的 python 脚本收集的 twitter 流时遇到问题。输出如下所示:
{"created_at":"Wed May 07 20:53:05 +0000 2014", "id":464145921098674177, "id_str":"464145921098674177" ...
... 并在一行中继续此单个条目。每一行都是一条推文,其中包含大量结构相同的信息。
我尝试过简单地使用 python 的 JSON 模块将 json 文件转换为 dict,但它一直给我一个错误 - 说明该结构不是 JSON 序列化。
最后,我想将 JSON 输出输入表格格式。我正在尝试将文件放入 csv 并从那里开始。在这一点上,我会满足于任何可读的东西。仅供参考 - 我正在尝试坚持使用 Python,因为这是我所知道的。
这是我尝试使用的python代码:
导入 json
json_file = open('twitterOutput.json', 'r').readlines()
j = json.loads(json_file[0])
打印 j
这给了我错误:“无法解码 JSON 对象”。仅供参考 - 这只是测试代码。我只是想尝试让 json_file 列表的其中一行工作。
谢谢。
【问题讨论】:
-
你能展示你已经尝试过的东西,这样我们就不会重复你可能已经做过的事情了吗?你试过
json.loads(twitter_output_string)或json.load(twitter_output_buffer)吗?无论如何,请编辑问题以显示您的确切代码和您得到的确切错误。 -
感谢您的回复...我已将我的 python 代码添加到原始帖子中。
-
你不能这样做
j = json.loads(json_file[0]),因为文件的一行本身不太可能是格式正确的 JSON。例如,格式良好的 JSON 的开头和结尾需要有{和};更多关于here