【发布时间】:2011-12-12 13:02:53
【问题描述】:
我有一组单词,我有兴趣根据两个或多个单词的出现来查找句子的重复项:
例子:
我想检测句子中的“男孩”或“男孩”和“女孩”或“女孩”,这样我就可以拥有这些集合:(男孩和女孩)、(男孩和女孩)、(女孩和男孩) ) 和 (男孩和女孩)。
句子:
男孩要和一个女孩一起上学,因为男孩非常喜欢女孩。
句子表示:
WORD1带着WORD2去上学,因为WORD3太喜欢WORD4了。
我怎样才能有四 (4) 种不同形式的句子,使它看起来像这样:
输出:
The WORD1 is going to school with a WORD2, because the WORD like the WORD so much.
The WORD1 is going to school with a WORD, because the WORD like the WORD4 so much.
The WORD is going to school with a WORD2, because the WORD3 like the WORD so much.
The WORD is going to school with a WORD, because the WORD3 like the WORD4 so much.
注意。
字数可以是动态的,从2个或更多;在这个例子中,我有 4 个单词。
【问题讨论】:
-
一种方法是为每个组合设置一个正则表达式。您可以从允许的单词对构建每个正则表达式,然后使用交替
|运算符将它们连接在一起。 -
@user5402:能给我举个例子吗?
-
为什么输出包含第五个“WORD”而没有数字后缀?它代表四个输入词中的哪一个?
-
@Jonathan - 'WORD' 只是我用来替换其他成对单词的符号,在新生成的句子中是一个无关紧要的符号。
-
我不得不说我不是很理解这个问题。你有一个给定的句子,你想用另一组词替换给定的词并形成四个新句子?