【发布时间】:2016-11-04 10:53:17
【问题描述】:
我有一个很大的句子列表,其中一些彼此相似但有点不同。 类似:
[单词1] [单词2] [单词3]
[word1] [word3]
[word1] [word2] [word3] [word4]
我想删除“重复”,只得到一句话。 只是问在java中是否可能?
【问题讨论】:
-
不确定我是否在关注。预期的输出是什么?
-
我有 10k 个彼此相似的句子列表,我希望得到大约 1k 个没有重复的句子(其中一些有 5 个副本,一些 20 个)每个句子一个