【发布时间】:2019-05-05 06:14:42
【问题描述】:
我下载了一个 Facebook 消息数据集,其格式如下:
f\u00c3\u00b8rste student
应该是første student,但我似乎无法正确解码。
我试过了:
str = 'f\u00c3\u00b8rste student'
print(str)
# 'første student'
str = 'f\u00c3\u00b8rste student'
print(str.encode('utf-8'))
# b'f\xc3\x83\xc2\xb8rste student'
但它没有用。
【问题讨论】:
-
'ø'是'\u00f8' -
你的字符串实际上是:'første student'
-
@Rafael 这无济于事
# -*- coding: utf-8 -*-仅指定源代码的文件编码。 -
@vhflat:索鲁;我重新打开了。