【发布时间】:2018-05-19 08:11:49
【问题描述】:
我想在 Python 3 中将单词“c++”与单词边界匹配。但我的猜测是 \b 也会在加号上触发。
为了清楚起见,我已简化为以下测试用例:
\bc\+\+\b
我希望我可以保留单词边界但以某种方式更改其设置。
这样做的原因是我想将正则表达式放在 TfidfVectorizer 中的 token_pattern 中,我无法控制它们如何使用它。
【问题讨论】:
-
尝试
(?<!\S)c\+\+(?!\S)或保留第一个单词边界。这实际上取决于您对单词边界的期望。 -
这个案子
some text -c++... with .c+++怎么样? -
照常使用
(?<!\w)c\+\+(?!\w)
标签: regex python-3.x