【发布时间】:2021-09-12 21:38:14
【问题描述】:
所以我将一些数据抓取为 JSON 文件格式,但保存的数据中有一些不需要的字符 例如:
"quote_text": "\u201c我们创造的世界是我们思考的过程。不改变我们的想法就无法改变它。\u201d", “作者”:“阿尔伯特·爱因斯坦”, “标签”:[ “改变”, “慎重考虑”, “思维”, “世界”
那么如何在 python 中从文件中删除这些 \u201c 类型的字符
【问题讨论】:
-
'\u201c'和'\u201d'是左右引号 - MS Word 使用的“弯引号”。如果您要执行print(your_json['quote_text']),您会将它们视为引号而不是它们的转义表示。 -
这个
print(' '.join(data['quote_text'].split()))应该修复它。
标签: python json web-scraping scrapy