2009-06-23 85 views
5

我一直在使用nutch一段时间,最近我知道关于这个度假胜地。Zend_Search_Lucene的性能和瓶颈?

它的性能如何?它支持的文件大小限制是多少?

此外,如何删除或更新索引,而不是每次有修改重新索引?

回答

8

Zend_Search_Lucene是Apache Lucene格式的纯PHP实现。目前(从ZF 1.6开始)支持的Lucene索引格式版本是1.4 - 2.3。有关Lucene的更多信息,请访问http://lucene.apache.org/java/docs/

就索引大小限制而言,32位平台的索引大小受限制为2GB,据我所知,不限于64位平台。

性能在很大程度上取决于您如何构建索引。请务必检查manual that deals with performance的部分。

此外,Luke(Lucene索引的诊断工具)在性能优化和故障排除方面非常方便。

P.S.关于更新,Lucene索引文件格式不支持文档更新。应该删除文件并重新添加到索引以有效更新它们。对于Java实现也是如此。

+0

感谢您的评论。 但nutch可以合并新的和旧的索引到另一个,为什么不能Lucene?Nutch是基于Lucene的。 顺便说一句,是由nutch直接可用Zend_Search_Lucene生成的索引文件? – omg 2009-06-23 18:07:53