【发布时间】:2014-05-13 06:54:42
【问题描述】:
我正在用 python 读取一个 utf8 编码的 csv 文件
f = open('test.csv', 'r')
reader = csv.reader(f)
r = reader.next()
r[10]
返回
'\xc3\x9altima actualizaci\xc3\xb3n del ejercicio 2014: 27 Abril 2014.'
那应该是'Última actualización del ...'
我只是想知道该数据是如何编码的(可能是多字节?)以及如何将其转换为具有以下内容的普通字符串:'Última actualización del ...'
我试过了:
r[10].decode('utf8')
但我得到了
u'\xdaltima actualizaci\xf3n del ejercicio 2014: 27 Abril 2014.'
【问题讨论】:
-
你用的是哪个版本的python?哪个IDE?你读过this吗?
-
这是一本非常好的读物,它将解释发生了什么。 joelonsoftware.com/articles/Unicode.html