【发布时间】:2026-01-31 23:15:02
【问题描述】:
如何将 Unicode 字符串(包含额外字符,如 £ $ 等)转换为 Python 字符串?
【问题讨论】:
-
我们需要知道您使用的 Python 版本,以及您调用的 Unicode 字符串是什么。在包含引起麻烦的货币符号的简短 unicode_string 上执行以下操作: Python 2.x :
print type(unicode_string), repr(unicode_string)Python 3.x :print type(unicode_string), ascii(unicode_string)然后编辑您的问题并复制/粘贴上述打印语句的结果。不要重新输入结果。还要查看 HTML 顶部附近的内容,看看是否可以找到类似这样的内容:我怀疑你从网络请求中获得了 unicode。你可能会得到 UTF-8 编码的 Unicode。@lutz:“UTF-8 编码的 Unicode”到底是不是 unicode?span>您应该真正阐明 unicode string 和 python string 的含义(我猜最好给出具体示例),因为从cmets对你的问题有不同的解释。我想知道你为什么没有这样做,尽管你问这个问题已经超过 3.5 年了。@jalf: 如果是encoded;它不再是 Unicode,例如unicode_string = u"I'm unicode string"; bytestring = unicode_string.encode('utf-8'); unicode_again = bytestring.decode('utf-8')
标签: python string unicode type-conversion