在单个或多个核心上存储多组文档

我从同一个中间件运行多个内容/设计单独的网站，我想将Solr用作搜索引擎。这些站点在域中有所不同，但不在内部结构中（即，站点之间的实际数据库和数据结构是相同的）。在单个或多个核心上存储多组文档

现在的问题是 - 将单个Solr索引中的网站数据存储在单个Solr索引中，然后用“site”字段分隔它，还是在单个JVM中为每个站点使用单独的Solr内核？

什么会提供最佳性能（没有跨站点查询）？什么会提供最好的召回和精确度（我担心由于IDF因素而导致精度损失 - 内容域的差异非常大）？

2011-12-21 Mavrik

我假设你更担心，当你的网站增长会发生什么多个Solr的核心。海事组织，多核心似乎是更好的选择。

单一大型索引：所有更新和查询都会影响单个点。当它开始变慢时，您必须通过分片或复制来创建集群以存储您的大型索引。这是一个单一的失败点。备份索引将非常困难。

多核：如果一个网站的增长和矮化别人，你可以很容易地将其迁移到另一台服务器，以确保服务器没有超载。备份个人网站将是相对微不足道的。

当你有非繁忙的网站时，多核心会让你的生活变得更简单。随着您的网站的增长，您可以延迟群集和性能调整。

2011-12-21 17:37:45 aitchnyu

确切地说，我很担心网站变大，网站数量增加时会发生什么情况。 – Mavrik 2011-12-21 22:15:58

我会做一个单一的Tomcat

2011-12-21 17:26:27

回答