【问题标题】:Python Unicode: Can I get back my ñ? [duplicate]Python Unicode:我可以取回我的 ñ 吗? [复制]
【发布时间】:2014-12-05 20:55:43
【问题描述】:

我已经阅读了几个关于 python 如何处理 unicode 的 SO 问题和博客文章,但我仍然有点困惑。我正在通过scrapy刮擦并从网页上得到这个:u'Isla de Se\xf1orita'。应该是u'Isla de Señorita'。我知道我可以做类似的事情..

>>> u"ñ"
u'\xf1'
>>> u"ñ".encode("utf-8")
'\xc3\xb1'

但是我该怎么做呢?我可以从这些字节中找回u"ñ" 吗?我只想要 ñ 以便我可以将其保存到 django 模型中的字段中。谢谢。

【问题讨论】:

  • Python 试图在这里提供帮助并产生 ASCII 友好的调试输出。 ñ 是 Unicode 中的 U+00F1,因此 Python 显示 \xf1 以指示该值,即使将其复制并粘贴到除了 ASCII 之外无法处理任何内容的终端或编辑器中也不会中断。

标签: python python-2.7 unicode


【解决方案1】:

你的ñ还在。它只是编码不同。在我的 python 解释器中查看此操作:

>>> print '\xc3\xb1'
ñ

也许我不清楚你所说的“找回”是什么意思?

【讨论】:

  • 当我输入同一行代码时,我得到├▒,但如果我输入print u"ñ",我又得到ñ 这是为什么?但无论如何,我从来没有尝试将它打印出来>_
  • @pyramidface:仅当终端或控制台实际配置为处理 UTF-8 时,将 UTF-8 写入终端或控制台才有效。你的不是。请参阅我关闭你的帖子作为副本。
  • @MartijnPieters 啊,好的,谢谢你解决这个问题。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2012-06-17
  • 2013-04-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多