【发布时间】:2023-03-27 08:07:01
【问题描述】:
apache nutch 中的新手 - 编写客户端以通过 REST 使用它。 在所有步骤(INJECT,FETCH ...)中成功 - 在最后一步 - 当尝试索引到 solr - 它无法传递参数。 请求(我在某些网站上对其进行了格式化)
{
"args": {
"batch": "1463743197862",
"crawlId": "sample-crawl-01",
"solr.server.url": "http:\/\/x.x.x.x:8081\/solr\/"
},
"confId": "default",
"type": "INDEX",
"crawlId": "sample-crawl-01"
}
Nutch 日志:
java.lang.Exception: java.lang.RuntimeException: Missing SOLR URL. Should be set via -D solr.server.url
SOLRIndexWriter
solr.server.url : URL of the SOLR instance (mandatory)
solr.commit.size : buffer size when sending to SOLR (default 1000)
solr.mapping.file : name of the mapping file for fields (default solrindex-mapping.xml)
solr.auth : use authentication (default false)
solr.auth.username : username for authentication
solr.auth.password : password for authentication
at org.apache.hadoop.mapred.LocalJobRunner$Job.runTasks(LocalJobRunner.java:462)
at org.apache.hadoop.mapred.LocalJobRunner$Job.run(LocalJobRunner.java:522)
实施了吗?传递给 solr 插件的参数?
【问题讨论】: