【发布时间】:2009-06-23 17:30:28
【问题描述】:
我使用 nutch 已经有一段时间了,直到最近才知道这个度假村。
它的性能如何,它可以支持的文件大小限制是多少?
另外,每次修改后如何删除或更新索引而不是重新索引?
【问题讨论】:
我使用 nutch 已经有一段时间了,直到最近才知道这个度假村。
它的性能如何,它可以支持的文件大小限制是多少?
另外,每次修改后如何删除或更新索引而不是重新索引?
【问题讨论】:
Zend_Search_Lucene 是 Apache Lucene 格式的纯 PHP 实现。当前(从 ZF 1.6 开始)支持的 Lucene 索引格式版本为 1.4 - 2.3。有关 Lucene 的更多信息,请访问http://lucene.apache.org/java/docs/。
就索引大小限制而言,32位平台的索引大小限制为2GB,据我所知,64位平台不限制。
性能在很大程度上取决于您构建索引的方式。请务必检查manual that deals with performance的部分。
另外,Luke(Lucene 索引的诊断工具)在性能优化和故障排除方面非常方便。
附:关于更新,Lucene 索引文件格式不支持文档更新。应删除文档并将其重新添加到索引中以有效更新它们。 Java 实现也是如此。
【讨论】: