我知道在网络上以及SO上有几个关于Lucene中索引和查询性能的主题,但是我还没有找到一个讨论是否(如果有的话,多少?)建立有效载荷将影响查询性能...Lucene中的有效载荷性能
这里的情景......
比方说,我想索引的文件(从100K随时随地集合 - 10M),每个文件都有一个小节是我希望能够单独搜索(或者可能排名较高,取决于在该部分中是否找到了匹配项)。
我正在考虑在该子部分中出现的任何术语中添加有效负载(索引期间),以便在查询时有效地做出该决定。
有谁知道任何与使用有效载荷相关的性能问题,或者甚至更好,你能指点我关于这个话题的任何在线文档吗?
谢谢!
编辑:我欣赏我的方案的替代解决方案,但万一我确实需要在将来使用有效载荷,没有人有关于有关查询性能原始问题的任何意见?
看看Compass(http://www.compass-project.org/),它使得在Lucene之上的这种高性能分层更容易。 – skaffman 2009-09-15 21:40:54
感谢您的建议,我今天下午刚刚遇到了Compass,所以很高兴知道我可能会走在正确的轨道上。如果我有任何运气,我会尽力报告。 – jeremyalan 2009-09-15 21:42:30