【发布时间】:2017-04-04 08:17:03
【问题描述】:
我从 twitter API 收集了一些推文并将其存储到 mongodb,我尝试将数据导出到 JSON 文件并且没有任何问题,直到我尝试制作一个 python 脚本来读取 JSON 并将其转换到 csv。我的代码出现此回溯错误:
json.decoder.JSONDecodeError: Extra data: line 367 column 1 (char 9745)
因此,在浏览了互联网之后,有人指出我在在线验证器中检查了实际的 JSON 数据,我确实这样做了。这给了我以下错误:
Multiple JSON root elements
来自网站https://jsonformatter.curiousconcept.com/
或数据链接here
现在,问题是,我在互联网上没有找到任何关于如何处理该错误的信息。我不确定这是否是我收集、导出的数据有误,或者我只是不知道如何使用它。
我对这些推文的最终目的是制作一个网络图。我正在查看 Networkx 或 Gephi,这就是我想要获取 csv 文件的原因。
【问题讨论】:
-
我很惊讶。能把导出的json文件的开头和结尾贴一下吗?
-
@RobertMoskal 我用文件的图片更新了原始帖子。由于数据中的某些链接被缩短,stackoverflow 不允许我发布代码。
-
请将示例数据上传到某个文件共享网站并分享链接。
-
@MohammadYusufGhazi 这里是指向数据的链接mediafire.com/?8nwiv7noboccuj4 不幸的是它对于 pastebin 来说太大了
-
Export valid json from mongodb collection 的可能重复项。该线程有你需要的答案。
标签: python json mongodb csv twitter