【发布时间】:2015-05-18 05:25:16
【问题描述】:
我的 SOLR 中有大约 2000 万 个文档。我在 SOLR 中使用 DIH 来索引 delta 更新。为最后一小时编制增量导入索引大约需要 2-3 小时,完全导入大约需要 5-6 小时 完成。除了DIH,还有什么方法可以加快这个过程吗??
【问题讨论】:
-
是索引需要时间 - 还是从数据库中检索内容?如果后端必须多次扫描整个表,则错误或丢失的索引可能会使任何大型导入作业变慢。增量导入中有多少新文档?
-
新文档将低于 500。但现有文档的更新量会很大。我还使用连接从大约 14-15 个表中导入数据。