【发布时间】:2019-05-21 07:50:16
【问题描述】:
我使用的是 nutch 1.15 和 solr 7.5,需要索引多个内核。我为每个核心创建了单独的 crawldb 和 linkdb,然后使用多个写入器更新了 index-writers.xml(每个 writer_id 匹配相应核心的名称)。此外,param name="url" 指向每个 solr 核心,但由于没有地方可以传递指示 writer id 或 solr 核心的参数,bin/nutch index 命令针对所有核心索引特定的 crawldb。当然,我只需要将 crawldb1 索引到 core1。
有解决这个问题的建议吗?
提前致谢。
【问题讨论】: