【发布时间】:2021-08-06 04:18:03
【问题描述】:
我有一个 JSON 文件 (tweetObject.json),其中包括大约 600 行,其中每行是来自 Twitter API 的响应,其中包含大约 100 条推文及其元数据。
我的问题:
- 如何从我的 JSON 文件中提取特定的推文属性,例如
username? (我正在考虑将 JSON 加载到 pandas 数据框中,其中每列仅存储一个属性/字段,然后选择我需要的特定属性。但我也愿意接受任何其他解决方案。 - 如何将 JSON 文件加载到 pandas 数据框中?我使用了
json.load,但我得到了JSONDecodeError: Extra data: line 2 column 1 (char 173419)。经过一番研究,我发现这个错误的原因可能是因为json.load没有解码多个JSON对象。 - 我还有一个扁平化的 JSON 文件版本,每行保留 1 条推文。我也用这个文件尝试了
json.load,但仍然得到同样的错误。
这是我加载 json 的代码:
with open('tweetObject_v2.json') as json_file:
data_list = json.load(json_file)
抱歉,我没有写推文对象 JSON 的示例,因为这个文件的一行太长了。但您可以在此处找到示例 Twitter API (v2) 响应:https://developer.twitter.com/en/docs/twitter-api/data-dictionary/example-payloads
【问题讨论】:
-
在我的回答中添加了几个数据框提取示例
标签: python json pandas twitter nested