【发布时间】:2013-01-04 19:26:24
【问题描述】:
在 Python 2.7 中,如何将 latin1 字符串转换为 UTF-8。
例如,我正在尝试将 é 转换为 utf-8。
>>> "é"
'\xe9'
>>> u"é"
u'\xe9'
>>> u"é".encode('utf-8')
'\xc3\xa9'
>>> print u"é".encode('utf-8')
é
字母是é,它是拉丁小写字母E,带尖音(U+00E9)
UTF-8 字节编码为:c3a9
拉丁字节编码为:e9
如何获得拉丁字符串的 UTF-8 编码版本?谁能举例说明如何转换é?
【问题讨论】:
-
你读过Python Unicode HOWTO了吗?如果没有,你应该!
-
@MartijnPieters 我有,但编码总是有点混乱。
标签: python encoding utf-8 python-2.7 latin1