【发布时间】:2014-12-05 20:55:43
【问题描述】:
我已经阅读了几个关于 python 如何处理 unicode 的 SO 问题和博客文章,但我仍然有点困惑。我正在通过scrapy刮擦并从网页上得到这个:u'Isla de Se\xf1orita'。应该是u'Isla de Señorita'。我知道我可以做类似的事情..
>>> u"ñ"
u'\xf1'
>>> u"ñ".encode("utf-8")
'\xc3\xb1'
但是我该怎么做呢?我可以从这些字节中找回u"ñ" 吗?我只想要 ñ 以便我可以将其保存到 django 模型中的字段中。谢谢。
【问题讨论】:
-
Python 试图在这里提供帮助并产生 ASCII 友好的调试输出。 ñ 是 Unicode 中的 U+00F1,因此 Python 显示
\xf1以指示该值,即使将其复制并粘贴到除了 ASCII 之外无法处理任何内容的终端或编辑器中也不会中断。
标签: python python-2.7 unicode