【发布时间】:2016-08-04 12:48:21
【问题描述】:
虽然有类似的问题,但我似乎无法为我的案例找到可行的解决方案:
我在字符串中遇到了一些烦人的十六进制字符,例如
'\xe2\x80\x9chttp://www.google.com\xe2\x80\x9d blah blah#%#@$^blah'
我需要删除这些十六进制 \xHH 字符,并单独删除它们,以获得以下结果:
'http://www.google.com blah blah#%#@$^blah'
解码没有帮助:
s.decode('utf8') # u'\u201chttp://www.google.com\u201d blah blah#%#@$^blah'
我怎样才能做到这一点?
【问题讨论】:
标签: python python-2.7 utf-8 character-encoding string-parsing