【发布时间】:2018-08-01 05:14:51
【问题描述】:
为了清理一些字符串,我必须删除一些包含一些特殊 UTF-8 字符的子字符串。
示例:
source = "Skoda"
to_be_clean = "Škoda Rapid"
我需要从to_be_clean 替换字符串source。
显然,to_be_clean 字符串包含一些特殊字符。有没有办法简单地完成这项任务。
这就是我今天的做法。
output = to_be_clean.replace(source + ' ', '')
我正在考虑一个正则表达式,但我需要列出所有可能的字符。
【问题讨论】:
-
真的不清楚你想要什么。您是否希望找到一种方法使
"Škoda"等于"Skoda"以便您可以删除它?关于从 Unicode 中删除重音有很多问题;你用谷歌搜索过吗?
标签: python string python-3.x