什么是分割现有的Lucene索引分为两半,即每个分割应该包含一半的文档总数的原指数分裂Lucene索引分为两半
1
A
回答
3
拆分现有的索引(不重建索引的所有文件)最简单的方法是:
- 制作现有指数的另一个副本(即CP -r myindex mycopy)
- 打开的第一个索引和删除一半的文档(范围为0〜maxDoc/2)
- 打开第二索引,并删除其他半(范围maxDoc/2到maxDoc)
- 优化两个指数
这可能不是最有效的方法,但它只需很少的编码就可以完成。
1
一个相当稳健的机制就是用最好的方式以文件的校验和为模数,索引的数量来决定它将进入哪个索引。
1
最近的Lucene版本有一个专门的工具来执行此操作(在contrib/misc下有IndexSplitter
和MultiPassIndexSplitter
)。
相关问题
- 1. 分裂阵列分为两个部分
- 2. 索引字段的Lucene 4.2分析器
- 3. 分裂为preg_split
- 4. xml分成两半
- 5. Unix的分裂1个栏为两列
- 6. 俄罗斯剧情分裂为两个
- 7. 按多个索引编号的分区Lucene索引
- 8. 拆分Lucene索引文件而不重新索引
- 9. 将屏幕分为两部分,并将imageview放在一半的两半上
- 10. Postgres的 - 分裂TSTZRANGE两列
- 11. 分裂两个双,C#
- 12. 分裂时,有两个词
- 13. 分裂VTK POLYDATA两个POLYDATA
- 14. 分裂周期分为月部分
- 15. Lucene搜索评分问题
- 16. 将Android屏幕分成两半等分
- 17. 将表格分成两半
- 18. 当分区有本地二级索引时是否发生分区分裂?
- 19. 分裂
- 20. 分裂
- 21. Lucene的分析器进行索引和搜索
- 22. Lucene Grails可搜索的插件构建索引的部分表
- 23. Lucene索引
- 24. Apache lucene索引
- 25. Lucene索引MAXFieldLength
- 26. Jackrabbit Lucene索引
- 27. Zend Lucene索引
- 28. Lucene索引
- 29. 如何通过分离分裂句两个部分只有
- 30. 分裂和readline - 列表索引超出范围
只是为了清楚起见:您想分割索引*而不重新索引文档,对吧? – 2010-05-19 13:48:08
是的,你是对的!我不想重新阅读索引,并再次使用IndexWriter来构建两个索引。相反,这样做的一些自动方式寻求 – Akhil 2010-05-19 13:57:08
你能提供一些这方面的商业理由吗?最简单的方法是读取并循环访问IndexReader类。 – Mikos 2010-05-20 03:45:28