【发布时间】:2016-06-07 10:35:57
【问题描述】:
R gsub("[^[:alnum:]['-]", " ", my_string) 中已经有一个接近的 answer,但它在 Python 中不起作用:
my_string = 'compactified on a calabi-yau threefold @ ,.'
re.sub("[^[:alnum:]['-]", " ", my_string)
给'compactified on a calab yau threefold @ ,.'
因此,它不仅删除了单词内破折号,还删除了破折号之前单词的最后一个字母。而且它不会删除标点符号
预期结果(没有任何标点符号但字内破折号的字符串):'compactified on a calabi-yau threefold'
【问题讨论】:
-
[:alnum:]匹配字母数字字符串。为什么不在 Python 中直接使用r'[^\w['-]'? -
我不知道我完全不懂正则表达式
-
你需要更具体地说明你想做什么。
-
为什么一件事在 R 中有效,但在 Python 中无效 - 无论如何,让我试试你的提议
-
@Alex 我怎么能比我的问题标题更明确?