【发布时间】:2011-10-17 21:11:23
【问题描述】:
开始着手归档数千份 PDF“报告”的项目。研究使它们可搜索的替代方案。希望用户能够输入搜索词并显示包含所述搜索词的报告列表,他们可以单击并在浏览器中查看。很简单。
Solr 似乎是我能找到的最流行的 PDF 支持选项...但我们不了解 Java...所以,寻找如何使用 Rails 的示例(或只是建议) /Sunspot。经过粗略的概述后,它看起来相当复杂(需要 Tika、Solr Cell、Sunspot 和 Solr 本身的深奥组合。虽然也许(阅读:希望)我错了?!?)。
Nutshell:我们希望将我们使用的任何搜索引擎指向包含 PDF 的文件夹,让它为它们编制索引。然后在 Rails 应用程序中,我们可以显示一个搜索对话框并管理查询和结果。
选项?难度?建议?提示?
【问题讨论】:
标签: ruby-on-rails pdf solr sunspot