【发布时间】:2019-10-30 15:56:20
【问题描述】:
我有一个文本文档语料库,其中一些会有一个子字符串序列。第一个和最后一个子串是一致的,并标记了我要替换的部分的开始和结束。但是,我还想删除/替换这些第一个和最后一个位置之间存在的所有子字符串。
origSent = 'This is the sentence I am intending to edit'
以上面为例,我将如何使用'the'作为开始子字符串,'intending'作为结束子字符串,除了它们之间存在的单词之外,删除它们以进行以下操作:
newSent = 'This is to edit'
【问题讨论】:
-
你需要更清楚地定义这些子字符串的规则,如果'the'和'intending'总是定义词,那么通过
str.split()当然是微不足道的