2011-12-21 76 views
1

我从同一个中间件运行多个内容/设计单独的网站,我想将Solr用作搜索引擎。这些站点在域中有所不同,但不在内部结构中(即,站点之间的实际数据库和数据结构是相同的)。在单个或多个核心上存储多组文档

现在的问题是 - 将单个Solr索引中的网站数据存储在单个Solr索引中,然后用“site”字段分隔它,还是在单个JVM中为每个站点使用单独的Solr内核?

什么会提供最佳性能(没有跨站点查询)?什么会提供最好的召回和精确度(我担心由于IDF因素而导致精度损失 - 内容域的差异非常大)?

回答

2

我假设你更担心,当你的网站增长会发生什么多个Solr的核心。海事组织,多核心似乎是更好的选择。

单一大型索引:所有更新和查询都会影响单个点。当它开始变慢时,您必须通过分片或复制来创建集群以存储您的大型索引。这是一个单一的失败点。备份索引将非常困难。

多核:如果一个网站的增长和矮化别人,你可以很容易地将其迁移到另一台服务器,以确保服务器没有超载。备份个人网站将是相对微不足道的。

当你有非繁忙的网站时,多核心会让你的生活变得更简单。随着您的网站的增长,您可以延迟群集和性能调整。

+0

确切地说,我很担心网站变大,网站数量增加时会发生什么情况。 – Mavrik 2011-12-21 22:15:58

0

我会做一个单一的Tomcat

相关问题