【发布时间】:2014-10-04 05:19:04
【问题描述】:
我正在使用 Python 工具检索 Twitter 数据,并将这些数据以 JSON 格式转储到我的磁盘中。我注意到一条用双引号括起来的推文意外转义了整个数据字符串。此外,实际 JSON 格式的所有双引号都用反斜杠转义。
它们看起来像这样:
"{\"created_at\":\"8 月 8 日星期五 11:04:40 +0000 2014\",\"id\":497699913925292032,
如何避免这种情况?应该是:
{"created_at":"Fri Aug 08 11:04:40 +0000 2014" .....
我的文件输出代码如下所示:
with io.open('data'+self.timestamp+'.txt', 'a', encoding='utf-8') as f:
f.write(unicode(json.dumps(data, ensure_ascii=False)))
f.write(unicode('\n'))
在后续处理步骤中读取 JSON 文件时,意外转义会导致问题。
【问题讨论】: