【发布时间】:2021-05-15 17:59:12
【问题描述】:
我使用 Twitter API 抓取了大量 Twitter 数据。 现在我将 JSON 文件存储在我的计算机上,我想将它们(大约 1000 个文件)组合成一个 csv 文件以进行进一步处理。
每个 JSON 文件如下所示:
200
{
"data": [
{
"author_id": "34571035",
"created_at": "2019-12-29T20:02:19.000Z",
"id": "1211376921407369216",
"text": "RT @ConnectedCarMag: Free online magazine for connected, autonomous and electric car professionals. Sign up 4 Connected Car mag #ConnectedC\u2026"
},
{
"author_id": "5946022",
"created_at": "2019-12-29T19:04:28.000Z",
"id": "1211362363351261184",
"text": "..."
},
...
我尝试了很多不同的代码来将 JSON 文件转换为单个 csv,但是当我尝试使用任何给定的代码时,我得到了错误代码之一:
JSONDecodeError:额外数据:第 2 行第 1 列(字符 4) JSONDecodeError:期望用双引号括起来的属性名称:第 2 行第 1 列(字符 2) ValueError:尾随数据
当我使用 pandas 将文件转换为 csv 时,我在使用 pd.read_json() 时已经遇到了问题。即使我尝试设置 lines=True,我什至无法在 Python 中将 JSON 文件作为 Dataframe 输入。
我对 Python 和整体编程非常陌生,因此非常感谢任何帮助。
【问题讨论】: