【发布时间】:2017-01-25 08:18:25
【问题描述】:
我必须为 solr 6.3 索引大约 4000 亿个文档。我正在使用pysolr 在索引之前解析我的 csv 数据。如何加快索引速度。为了将文档索引到 solr,它使用了 add 方法,默认情况下具有以下语法
add(self, docs, boost=None, fieldUpdates=None, commit=True, softCommit=False, commitWithin=None, waitFlush=None, waitSearcher=None, overwrite=None, handler='update')
一个基本选项是我应该将 commit 和 softcommit 设置为 false 以进行快速索引。方法对吗?
执行快速索引的任何其他选项?
【问题讨论】:
-
为什么不能直接批量提交CSV?带有批处理的 CSV 处理程序通常是一个非常快速的组合。
-
不知道怎么直接批量提交CSV。请分享一些细节