【问题标题】:Serving searchable PDFs with Rails使用 Rails 提供可搜索的 PDF
【发布时间】:2011-10-17 21:11:23
【问题描述】:

开始着手归档数千份 PDF“报告”的项目。研究使它们可搜索的替代方案。希望用户能够输入搜索词并显示包含所述搜索词的报告列表,他们可以单击并在浏览器中查看。很简单。

Solr 似乎是我能找到的最流行的 PDF 支持选项...但我们不了解 Java...所以,寻找如何使用 Rails 的示例(或只是建议) /Sunspot。经过粗略的概述后,它看起来相当复杂(需要 Tika、Solr Cell、Sunspot 和 Solr 本身的深奥组合。虽然也许(阅读:希望)我错了?!?)。

Nutshell:我们希望将我们使用的任何搜索引擎指向包含 PDF 的文件夹,让它为它们编制索引。然后在 Rails 应用程序中,我们可以显示一个搜索对话框并管理查询和结果。

选项?难度?建议?提示?

【问题讨论】:

    标签: ruby-on-rails pdf solr sunspot


    【解决方案1】:

    这是一篇博文:How to index file contents like pdf, doc, etc.. with Solr, Sunspot, Paperclip, S3 and Rails 3,其中显示了设置这一切的一些非常详细的步骤。

    【讨论】:

      【解决方案2】:

      Lucid Imagination 似乎在一篇不错的教程中涵盖了这个主题:http://www.lucidimagination.com/blog/2009/02/17/acts_as_solr_cell/

      【讨论】:

      • 谢谢!它看起来有点过时了......但我会通过它来寻找任何掘金。
      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-11-16
      • 2020-01-30
      • 1970-01-01
      • 1970-01-01
      • 2012-01-05
      相关资源
      最近更新 更多