【发布时间】:2015-09-18 04:24:08
【问题描述】:
我的索引中有如下条目:
ID BuildingName Postalcode Type
1 ABCD 1234 1
2 ABCD 7890 1
我需要删除出现在“BuildingName”字段中的重复项在搜索时(不是在索引中,因为您看到它们是两个不同的条目)。最后我只想看到(任何带有搜索名称的建筑物)
ID BuildingName Postalcode Type
1 ABCD 1234 1
为什么我不能使用此处所述的字段折叠/聚合 (Remove duplicate documents from a search in Elasticsearch) -> 因为我需要对 BuildingName 进行 n-gram 分析,并且字段折叠/聚合仅适用于未分析的字段。
有什么方法可以做到这一点? 所有帮助表示赞赏!谢谢!
【问题讨论】:
标签: elasticsearch duplicate-removal