【发布时间】:2026-01-29 21:20:04
【问题描述】:
我正在尝试使用已编译的正则表达式从字符串中匹配和删除列表中的所有单词,但我正在努力避免单词中出现。
当前:
REMOVE_LIST = ["a", "an", "as", "at", ...]
remove = '|'.join(REMOVE_LIST)
regex = re.compile(r'('+remove+')', flags=re.IGNORECASE)
out = regex.sub("", text)
在:“敏捷的棕狐跳过一只蚂蚁”
出:“快棕狐跳过t”
预期:“快速的棕狐跳过”
我尝试将字符串更改为以下内容,但无济于事:
regex = re.compile(r'\b('+remove+')\b', flags=re.IGNORECASE)
有什么建议还是我遗漏了一些很明显的东西?
【问题讨论】:
-
大概
ant是您删除列表的一部分?