【发布时间】:2015-03-20 15:59:29
【问题描述】:
我有一个包含 unicode 字符串的文件:u"L'\xe9quipe le quotidien"
我有另一个文件,从 Windows 导出并使用相同的字符串编码为 iso-8859-1:"L'<E9>quipe le quotidien"(这是在我的 shell 中从 less 复制/粘贴)。
使用decode('iso-8859-1').encode('utf8') 转换Windows 文件的内容会产生一个不同于Windows 文件中的字符串:L'équipe le quotidien。
进行这种比较的最佳方法是什么?我似乎无法将 latin1 字符串转换为 utf-8。
【问题讨论】:
标签: python python-2.7 utf-8 iso-8859-1 mojibake