【发布时间】:2014-03-14 22:00:10
【问题描述】:
我有许多文档,分布在多种语言中(目前为 6 个,不久的将来可能为 12 个)。无需猜测文档的语言,因为该信息是可用的。
此外,搜索的用例是这样一种搜索将始终使用一种语言,并且仅搜索该语言的文档。
现在,我想对索引和查询应用适当的语言处理,例如词干提取。建议的方式是什么?根据我有限的 Solr 知识,我可以想象:
- 每种语言只使用一个内核。保持索引小,查询通过核心 URL 匹配语言,配置简单。但是,它重复了很多配置。
- 使用一个核心并应用类似Solr: DIH for multilingual index & multiValued field? 的东西。搜索特定语言将不是通过诸如
title_de:sehen之类的字段
【问题讨论】:
标签: solr