【问题标题】:Multi-lingual Solr setup多语言 Solr 设置
【发布时间】:2014-03-14 22:00:10
【问题描述】:

我有许多文档,分布在多种语言中(目前为 6 个,不久的将来可能为 12 个)。无需猜测文档的语言,因为该信息是可用的。

此外,搜索的用例是这样一种搜索将始终使用一种语言,并且仅搜索该语言的文档。

现在,我想对索引和查询应用适当的语言处理,例如词干提取。建议的方式是什么?根据我有限的 Solr 知识,我可以想象:

  • 每种语言只使用一个内核。保持索引小,查询通过核心 URL 匹配语言,配置简单。但是,它重复了很多配置。
  • 使用一个核心并应用类似Solr: DIH for multilingual index & multiValued field? 的东西。搜索特定语言将不是通过诸如title_de:sehen 之类的字段

【问题讨论】:

    标签: solr


    【解决方案1】:

    我确信每种语言一个核心是最好的解决方案。

    您可以在核心之间共享除 schema.xml 之外的所有配置(使用单个 conf 文件夹)并指定每个核心的 schema.xml 位置(检查http://wiki.apache.org/solr/CoreAdmin

    【讨论】:

      【解决方案2】:

      我选择了单核。配置的重复令人生畏。现在这一切都在一个核心中。一点 Java 魔法,它完美地工作。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2012-04-29
        • 2010-09-15
        • 1970-01-01
        • 1970-01-01
        • 2014-02-12
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多