我正在尝试创建大约200万条记录的lucene。索引时间大约为9个小时。 你能否建议如何提高性能?如何:增加Lucene .net索引速度
7
A
回答
0
提高Lucene索引性能的最简单方法是调整IndexWriter的mergeFactor实例变量的值。这个值告诉Lucene将多少个文档存储在内存中,然后再将它们写入磁盘,以及将多个段合并在一起的频率。
http://search-lucene.blogspot.com/2008/08/indexing-speed-factors.html
3
我写了一篇关于如何并行Lucene索引一个可怕的职位。它真的写得非常糟糕,但你会发现它here(有一些示例代码,你可能想看看)。
无论如何,主要的想法是你把你的数据分成大块,然后在单独的线程上工作。当每件作品完成后,你将它们全部合并成一个索引。使用上述方法,我能够索引约4百万条记录。 2小时。
希望这给你一个从这里走的想法。
1
除了写入方面(合并因子)和计算方面(并行化)之外,这有时是由于最简单的原因:输入缓慢。许多人从数据库建立Lucene索引。有时候你发现这个数据的特定查询过于复杂而且速度很慢,无法很快返回所有(200万?)记录。尝试只查询和写入磁盘,如果它仍然在5-9小时的顺序,你已经找到了一个优化的地方(SQL)。
1
下面的文章真的帮了我,当我需要加快速度:
http://wiki.apache.org/lucene-java/ImproveIndexingSpeed
我发现,文献建设是我们的主要瓶颈。在优化数据访问和实施其他一些建议之后,我大大提高了索引性能。
相关问题
- 1. 增量索引lucene
- 2. 在Lucene中增加索引之后应该优化索引吗?
- 3. 增加速度
- 4. 如何增加ClickOnce下载速度?
- 5. 如何增加NavigatorIOS转换速度?
- 6. lucene如何索引文件?
- 7. 如何读取Lucene索引?
- 8. 索引如何使速度更快?
- 9. 如何加快ColdFusion中.NET AD的数据检索速度?
- 10. 使用codeigniter的速度全文搜索索引速度不如速度
- 11. 增加webservice的速度 - howto
- 12. 增加纸板速度
- 13. 增加pyserial readline速度
- 14. 如何使用Lucene FieldCache进行搜索速度提升?
- 15. 与btree索引相比,位图索引如何加快查询速度?
- 16. Lucene:搜索时加载索引文件?
- 17. Lucene索引
- 18. Apache lucene索引
- 19. Lucene索引MAXFieldLength
- 20. Jackrabbit Lucene索引
- 21. Zend Lucene索引
- 22. Lucene索引
- 23. Lucene .NET索引的索引浏览器(UI工具)
- 24. 在lucene.net中使用azure库搜索lucene索引时速度有点慢
- 25. lucene.net索引速度下降
- 26. 如何加快并发Lucene应用程序的速度?
- 27. 加速搜索.net 4.0
- 28. 增加大文件的加载速度
- 29. Lucene索引优化
- 30. Lucene索引大小
嗨埃斯特班 谢谢你的回应。我正在寻找类似于你所做的事情。您能否在您的博客中张贴一些代码片段。 谢谢, Gokul – Gokul 2009-06-27 04:52:43