【发布时间】:2014-03-12 01:09:22
【问题描述】:
我有一个文件包含
foo = "Gro\xdfbritannien"
我正在使用以下内容,但它始终显示带有 \x
的原始文本 import codecs
f = codecs.open('myfile', 'r', 'utf8')
for line in f:
print line
print line.encode('utf-8')
print line.decode('utf-8')
我看不到如何显示正确的编码文本,就像我正在做的那样
>>> print u'Gro\xdfbritannien'
Großbritannien
任何提示将不胜感激!
【问题讨论】:
-
如果你的文件确实有一个带反斜杠的带引号的字符串和一个
x,你需要用decode('string-escape')之类的东西来解析字符串。
标签: python utf-8 character-encoding internationalization utf