【发布时间】:2021-12-29 15:28:12
【问题描述】:
如何将异常字符转换为正常字符(例如,unicode字符),换句话说,解码异常字符/字符串如'â€Â'以显示其内容?
context='This Service does not use these “cookies†explicitly. However, the app may'
context1= context.encode('utf8') # encode('ascii')
print(context1)
输出:
b'This Service does not use these \xc3\x83\xc2\xa2\xc3\x82\xc2\x80\xc3\x82\xc2\x9ccookies\xc3\x83\xc2\xa2\xc3\x82\xc2\x80\xc3\x82\xc2\x9d explicitly. However, the app may'
我想打印没有这些字符的字符串 (â€Â)
【问题讨论】:
-
所以一个普通的
print(context),按原样打印字符,是不需要或不起作用的。非 ASCII 字符应该怎么办?是否应该将它们排除在打印输出之外或转换为它们的 ASCII 等效项 - unicode normalization? -
“正常”或“异常”字符是什么意思?这些像
“这样的非ASCII字符是否异常...是“€”(欧元的货币符号)正常吗? -
这看起来像 mojibake - 已使用多种编码进行编码的文本。你是怎么得到这个字符串的?
标签: python non-ascii-characters unicode-string