【问题标题】:Search engine algorithm in Java? [closed]Java中的搜索引擎算法? [关闭]
【发布时间】:2011-12-13 12:41:09
【问题描述】:

好吧,我真的是这个网站的新手,我想这才 2 个小时,所以我需要一段时间才能习惯该网站并提出不违反指南的问题。

我要做的只是实现一个小型搜索引擎,它不是家庭作业或工作,我只是学习就可以获得报酬。

搜索引擎将有一个简单的用户界面供用户提问和显示结果。

这个结果显然需要组织起来,它需要显示它找到的结果的数量,并且最相关的结果将显示在顶部 它还会有指向它找到的材料的链接。 我在 java 方面有一些经验,因此我需要一个算法来实现这一点。

有一百万种不同的搜索引擎,一些在java中,一些在php和其他语言中,但是它们已经实现了,我需要从头开始实现这个算法。

为此我买了一本书,名为“算法简介”,但这并没有我想象的那么有用。 我需要一些java指南,一个我需要做的代码形式的菜单。

如果有人可以提供帮助,我将不胜感激。 谢谢

【问题讨论】:

  • 你的问题太宽泛了。实现搜索引擎是一个非常大的主题/主题,根据您的具体需求有很多不同的方法。您已经拥有入门所需的所有信息(书籍、参考实现和现有的搜索引擎来模仿(并用于查找有关该主题的资源))。刚开始计划/编码。如果你在编码部分碰壁了,你可以回到这里具体的代码问题。
  • 就像一个网络搜索引擎?或者搜索您拥有的文件系统或数据库?

标签: java search-engine information-retrieval


【解决方案1】:

您可以使用库Apache Lucene,这是一个成熟的基于java的信息检索系统。
您必须创建一个IndexWriter,并将其用于index 您的文档集合。
然后,您应该使用IndexSearcher 搜索文档。请阅读文档,因为您可能需要的一切都已经构建好了。

如果你想从头开始实现它,我建议先阅读Information Retrieval。一个好的来源是Introduction to Information Retrieval

【讨论】:

  • 我在考虑一个文件系统
  • @james:我不关注,请解释您的评论。
  • 我的意思是说我正在考虑实现搜索引擎来搜索文件。
  • @james:如果您有这些文件的特定位置 [即一个特定的驱动器/目录/目录],您只需要像我提到的那样对它们进行索引,查看tutorial 并了解它是如何工作的。如果您的文件分散在网上,您还需要使用Web Crawler 来首先找到这些文件。
  • 作为程序员,如果有人要求你实现一个搜索引擎,你的出发点是什么,我的意思是你要做的第一件事是什么,一个图表?你能推荐一些材料吗?你会如何设计一个搜索引擎?
猜你喜欢
  • 1970-01-01
  • 2012-10-18
  • 2020-09-12
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2012-10-25
相关资源
最近更新 更多