【发布时间】:2015-09-19 01:22:17
【问题描述】:
我正在尝试在 python 中使用 urlib2 下载网页。
response = urlopen(url, timeout=10)
html = response.read()
html[170:198]
print html[170:198]
但据我了解,其中的“á”字符编码为“\u0e41”,即noThai Character Sara Ae。
Cadeia Acion\u0e41ria da Empresa
Cadeia Acionแria da Empresa
打印命令的输出应该是:
Cadeia Acionária da Empresa
谁能告诉我我做错了什么?
【问题讨论】:
标签: python unicode character-encoding urllib2