【发布时间】:2010-11-23 23:11:56
【问题描述】:
我正在开发一个需要集成搜索引擎的应用程序。这也应该进行爬行。请推荐一个基于 Java 的优秀搜索引擎。
提前谢谢你。
【问题讨论】:
标签: java search-engine web-crawler
我正在开发一个需要集成搜索引擎的应用程序。这也应该进行爬行。请推荐一个基于 Java 的优秀搜索引擎。
提前谢谢你。
【问题讨论】:
标签: java search-engine web-crawler
Nutch (Lucene) 是一个开源引擎,应该可以满足您的需求。
【讨论】:
过去我曾使用过terrier,这是一个用 Java 编写的搜索引擎:
Terrier 是一个高度灵活、高效、有效且强大的搜索引擎,可轻松部署在大规模文档集合中。 Terrier 实现了最先进的索引和检索功能。 Terrier 为大规模检索应用的快速开发提供了理想的平台。
【讨论】:
在过去的 2 年里,我一直在使用 C 开发我们自己的高性能搜索引擎。对于 Java,我强烈建议使用 Apache Lucene 作为上面提到的 Ajay。对于 Java,它在速度、相关性和功能方面都是最好的。
【讨论】: