【发布时间】:2017-10-14 09:13:19
【问题描述】:
根据文档,以下命令
'Brückenspinne'.encode("utf-8",errors='replace')
应该给我字节序列b'Br??ckenspinne'。然而,unicode 字符并没有被替换,而是被编码:
b'Br\xc3\xbcckenspinne'
你能告诉我我是如何真正消除 unicode 字符的吗? (我使用 replace 进行测试,我打算稍后使用'xmlcharrefreplace'。老实说,我想将 unicode 字符转换为它们的 xmlcharref,将所有内容都保留为字符串)。
谢谢。
【问题讨论】:
标签: python python-3.x unicode python-unicode