【发布时间】:2025-12-21 02:10:16
【问题描述】:
我有几百万条记录,我需要在 Solr 中对它们进行索引。一旦它们被索引,它们就不会被更改,并且这些集合仅用于“读取”。我通过将 xml 文档发布到 REST api 来遵循该模式,它工作正常......即使需要一些时间(配置已针对读取和缓存进行了优化);
但我想知道......有没有更好/更快的方法 - 也许避免 HTTP/网络层?比如在本地工作以构建集合,将其复制到 solr 服务器,然后添加/交换集合?
一个选择可能是自定义 DIH 用于第二个/备份核心并在完成后交换 - 但这意味着我将不得不“吃掉”solr 上用于缓存减慢搜索的内存。
我正在寻找/希望找到一个断开连接的解决方案——比如一个命令行工具,在另一台机器上运行,配置针对写入进行了优化,然后在生产中复制核心,用新的交换旧的。
有什么想法吗?
【问题讨论】:
标签: performance indexing solr dataset