【问题标题】:File search engine - where to start?文件搜索引擎 - 从哪里开始?
【发布时间】:2014-03-31 01:01:21
【问题描述】:

我必须为 Intranet 构建一个简单的文件搜索引擎(带有用于搜索 pdf、txt 等的字段的视图和用于显示最佳匹配的视图)。我正在寻找解决方案/建议:

我正在考虑 Django + Solr (haystack) 或 Drupal。是否有实现这一目标的开源平台?

编辑:

我选择了 Django + Haystack 解决方案。 http://django-haystack.readthedocs.org/en/latest/rich_content_extraction.html?highlight=pdf

【问题讨论】:

    标签: django drupal solr full-text-search search-engine


    【解决方案1】:

    除了在您选择的数据库中构建 django 模型之外,没有其他平台。安装 django-haystack、solr server 等...用 haystack 注册您的模型,构建您的 UI(实际上只有两个页面/3 个视图)

    在django中应该是一个比较简单的过程。

    一个views.py文件三个页面,

    索引,搜索(甚至不是一个页面,只是一个返回结果的视图,结果(模板显示搜索视图返回的数据库对象)。

    如果您有使用 Django 的经验,那么使用 Django 可以在 45 分钟内完成。没有经验可能需要几个小时,如果你挂断了可能需要几天。

    【讨论】:

    • 我已经为创建/搜索对象构建了一个简单的示例。下一步:索引/搜索文件。如果不是来自谷歌,不知道从哪里开始;)
    • django-haystack 文档很好地解释了如何设置 haystack。我推荐 solr,因为它是最容易设置的。您需要查找有关如何为您的特定平台安装 solr 服务器的说明。
    • 你甚至可以使用 django 的默认搜索功能,但它会真正匹配任何对字母 a 之类的搜索。基本上这对于生产来说是一种糟糕的方法,但如果你只是在做一个基本的项目来展示一个想法,那么 Java/Solr 可能是矫枉过正。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-07-03
    • 1970-01-01
    • 2010-10-02
    相关资源
    最近更新 更多