【发布时间】:2020-06-17 22:16:22
【问题描述】:
我有一个需要从给定句子中删除的短语(n-gram)列表。
removed = ['range', 'drinks', 'food and drinks', 'summer drinks']
sentence = 'Oranges are the main ingredient for a wide range of food and drinks'
我想得到:
new_sentence = 'Oranges are the main ingredient for a wide of'
我尝试了Remove list of phrases from string,但它不起作用('Oranges' 变成 'Os','drinks' 被删除,而不是短语 'food and Drinks')
有人知道怎么解决吗?谢谢!
【问题讨论】:
-
如果您需要处理复数,您可能应该为此使用自然语言处理库。
-
您是否尝试遍历已删除的列表并检测每个索引是否在句子中?
-
您可以通过将
removed列表与较长的短语优先排序来解决第二个问题。