【发布时间】:2021-04-15 18:13:09
【问题描述】:
我正在尝试使用正则表达式删除行号和 cmets,但它现在还不起作用:
import re
string = """(1) At what time.!? [asdf] School-
(2) bus. So late, already.!? [ghjk]"""
#res = re.sub(r"[\(\[].*?[\)\]]", "", string)
res = re.sub("(\d+) ","", res)
res = re.sub("[.*]","", res)
res = re.sub(r"-\s","", res)
res = re.sub(r"[^\w\säüöß]","", res)
res = re.sub("-\n","", res)
print(res.split())
所以我试图用我的#commented 行删除括号 () 和 [] 中的任何内容,但后来我被困在每行开头的空白处。 然后我决定把它拆分出来,想出了五个 re.sub 方法。
结果应该是这样的:
['At', 'what', 'time', 'Schoolbus', 'So', 'late', 'already']
我对没有被删除的行号感到困惑,尽管它们在 () 中并且应该消失了。然后导致我的 res.sub() 用于将带有“-”的单词从校车连接到校车也无法正常工作。
【问题讨论】: