【发布时间】:2014-03-28 20:55:12
【问题描述】:
我想知道如何替换除某个选定字符之外的所有正则表达式匹配项。
我需要清理数据。数据的一个例子是
`some-really,dirty.data%#$_.`
我想要的样子
some-reallydirtydata_
注意some 和really 之间的-。这是我选择的角色,我不想删除。
这是我的代码的 sn-p:
import re
unclean_string = "some-really,dirty.data%#$_."
clean_string = re.sub('\W', '', unclean_string)
print clean_string
>>>"somereallydirtydata_"
我知道\W 会删除除“0 到 9、a 到 z、A 到 Z 和下划线”之外的所有内容。
我想知道如何删除所有这些,以及一个选定的字符(例如-)。
免责声明:对于提出这样一个基本问题,我提前道歉。我是 Python 新手并使用正则表达式。
【问题讨论】: