【问题标题】:Multi lingual full text search with Sphinx使用 Sphinx 进行多语言全文搜索
【发布时间】:2020-08-20 20:22:44
【问题描述】:

我已经能够设置 sphinx 以进行英文全文搜索。但是,我所拥有的是混合的多语言文本(印地语-英语),我需要在其上创建索引。

我找不到太多关于如何在 sphinx 中实现它的信息。

或者我需要切换到其他数据库。

【问题讨论】:

标签: elasticsearch solr sphinx


【解决方案1】:

一般而言,您“只需”设置charset_table 以包含您要搜索的所有单词字符 http://sphinxsearch.com/docs/current/conf-charset-table.html

唉,默认设置只有真正定义好的英语和俄语字符集表 - 留给自己实施其他语言的 charset_table 规则。

维基 http://sphinxsearch.com/wiki/doku.php?id=charset_tables 是否有梵文列表可能可用?

Manticore Search(在评论中提到)在默认情况下确实有更精细的 charset_tables。它的默认“non_cjk”应该支持印地语。既可以在 Manticore 中使用它,也可以(稍加努力)向后移植它并在 Sphinx 中使用它。 https://github.com/manticoresoftware/manticoresearch/tree/master/src/charsets

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-07-15
    • 1970-01-01
    • 2017-04-03
    相关资源
    最近更新 更多