【问题标题】:Beginners Lucene tutorial [closed]初学者 Lucene 教程 [关闭]
【发布时间】:2010-11-18 19:51:22
【问题描述】:

我以前从未在 Java 中做过任何事情,但我想使用 Lucene 在网站上进行搜索。

我很难为一个完整的初学者找到一个好的分步教程。

谁能推荐一个好的教程?

谢谢

【问题讨论】:

  • 在深入 Lucene 之前,至少要学习 Java 的基础知识。同时做这两件事(很可能)是行不通的。
  • 您想用 Java 编写所有站点,还是只使用 Lucene 搜索您现有的站点并使用另一种编程语言?
  • 我只想用java索引站点,然后使用php,使用Zend库,在用户搜索站点时访问索引。
  • 我们更新了 Lucene 的 LingPipe 教程。最新的涵盖 Lucene 3.6。见:lingpipe-blog.com/2012/07/05/…
  • toptal.com 上非常好的 lucene 教程:toptal.com/database/…

标签: java lucene


【解决方案1】:

除了user428747的回答,你还可以阅读这个article

还有这个one(与第一个相比有点旧)。

顺便说一句,如果您想使用 Lucene,您是否考虑过使用 Solr? 它使用 lucene 搜索库并对其进行扩展,您可以阅读 here

【讨论】:

  • Solr 的 +1。如果您想快速设置搜索服务器,这就是您要走的路。
  • 感谢您的链接,我会阅读的。我没有考虑过 Solr,但我也会看看。
【解决方案2】:

经典:Lucene in Action

【讨论】:

  • +1 Lucene in Action。是迄今为止最好的初学者教程恕我直言。
【解决方案3】:

这个网站可能会对你有所帮助..

http://www.lucenetutorial.com/lucene-in-5-minutes.html

【讨论】:

    【解决方案4】:

    这不是对您在 Lucene 教程上的问题的直接回复(为此,我的回答与其他一些海报相同:Bob Carpenter 在 Lingpipe 博客上的 Lucene in 60 seconds 教程)。

    如果您不想仅仅为 Lucene 学习 Java,那么任何全文搜索数据库(Postgres/Mysql/etc)都应该可以解决您的目的。特别推荐Sphinx

    如果您需要您的搜索应用具有高性能/可扩展性(因为您将学习两件事 - Java 和 Lucene),此决定尤其重要。除非您有内部 Java 专家,否则最好打一场战争而不是同时打两场战争。

    【讨论】:

      【解决方案5】:

      也许 apache solr 更适合你:http://lucene.apache.org/solr/

      【讨论】:

        【解决方案6】:

        如果您使用 Zend,为什么不使用 Zend 的 PHP 端口 lucene?有关它的教程,请参阅here

        【讨论】:

        • 我实际上在使用 Codeigniter,但在其中使用 Zend Lucene。我读到使用 java 作为爬虫/索引器部分比使用 PHP 更好。
        • @user330936:是的,Java 会比 PHP 快。但这并不是 Lucene 独有的——Java 中的一切都会更快(这反过来又比 C 慢,而 C 比汇编慢……)为 lucene 使用一种新语言是个好主意。