【发布时间】:2012-06-27 05:40:24
【问题描述】:
我正在尝试使用 Lucene 进行 undup 或 dedup 匹配。本质上,我有一个文件,其中包含要根据某些字段(模糊搜索)进行分组的记录,并使用匹配键返回结果,该匹配键告诉我该文件中的哪些记录相互匹配。
这可能吗?
【问题讨论】:
-
你试过什么?你是如何使用 lucene 的(有很多不同语言/框架的版本)?帮助我们帮助您。
-
我正在使用 Java Lucene 3.6。我可以在索引后遍历输入文件并在我感兴趣的字段上搜索索引。这似乎效率低下,因此我想知道是否有一种有效的方法来匹配索引中的文档。