【问题标题】:How do I install the Rich Document patch on solr on Windows?如何在 Windows 上的 solr 上安装 Rich Document 补丁?
【发布时间】:2012-07-18 12:13:33
【问题描述】:

文档说要看这个页面:http://wiki.apache.org/solr/HowToContribute#Working_With_Patches

但这并没有太大帮助。

我已经下载了 rich.patch (http://wiki.apache.org/solr/UpdateRichDocuments#Updating_a_Solr_Index_with_Rich_Documents_such_as_PDF_and_MS_Office) 并且我已经 cd'd 进入了我的 solr 主目录。我尝试运行以下命令:

patch -p0 -i rich.patch

它只是询问我要修补哪个文件。例如,它会这样说:

can't find file to patch at input line 2681
Perhaps you used the wrong -p or --strip option?
The text leading up to this was:

Index: example/solr/conf/solrconfig.xml

当它提示我时,对于我想要修补的文件,我只需输入我的 solrconfig.xml 文件的路径,“C:\xampp\solr\conf\solrconfig.xml”

当我这样做时,它成功地更新了我的 java/org 文件夹以包含 ExcelParse.java、PowerPointParser.java 等。但是当我尝试使用“java -jar post.jar .”,我得到错误

FATAL: Solr returned an error #400 Bad Request

【问题讨论】:

标签: tomcat solr lucene


【解决方案1】:

rich.patch 已在 Solr 1.4 版本中修复,您应该能够使用 Solr 解析和索引 Rich 文档,无需任何补丁。

正如毛里西奥所说,请查看ExtractingRequestHandler

还请查看:-

posting-rich-documents-to-apache-solr-using-solrj-and-solr-cell-apache-tika
indexing-rich-files-into-solr-quickly-and-easily

【讨论】:

  • 我如何索引文件?我只做“java -jar post.jar mydoc.doc”吗?因为我不断收到“FATAL: Solr returned an error #400 Bad Request”。
  • 您可以使用 curl 命令上传文件。检查例如@wiki.apache.org/solr/…
猜你喜欢
  • 2015-10-30
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-11-04
  • 2018-09-01
  • 2010-10-05
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多