2011-04-11 65 views
0

我知道有一些半相似的问题,但在这种情况下,我正在构建一个脱机索引,直到构建完成。我从零开始构建了两个核心,一个拥有大约30万条记录,包含大量的引用信息和大块全文(这是文档索引),另一个核心有大约660万条记录,全文(这是页面索引)。在离线Solr/Lucene索引上多久调用一次commit?

鉴于此索引正在脱机构建,唯一真正的性能问题是构建速度。没有人应该查询这些数据。

如果我停止添加物品50秒,自动提交显然会触发?我不这样做。我一次添加十个,每隔几秒添加一次。

那么,我应该更频繁地提交吗?我觉得这个运行时间越长得到的速度越慢,至少在我的6k文档的索引测试案例中。

没有人在搜索这个索引时,有多少人会建议我提交?

应该说我正在使用Solr 3.1和SolrNet。

+0

出于兴趣,我运行了大约6k个文档的索引测试用例,在每500个之后提交。它似乎运行得更快,虽然只有5%,所以它可能是其他因素。 – 2011-04-12 11:08:06

回答

0

虽然它的承诺是花费你的时间,但你可能要考虑查看其他调整而不是提交频率。

它是索引核心还搜索,或索引结束后它在别的地方复制?如果后者是这种情况,那么关闭高速缓存可能会对性能产生非常显着的影响(solr rebuilds caches every time you commit)。

0

您还可以使用Solr的autoCommit或commitWith功能进行研究。