2014-11-21 58 views
0

我试图在我的datastax企业集群中设置一些hadoop节点以及一些cassandra节点。在这一点上有两件事情我不清楚。一,我需要多少个hadoop节点?它是否与cassandra节点数量相同?数据仍然存在于cassandra节点上吗?其次 - 教程提到我应该在hadoop节点上禁用vnodes。我仍然可以在该群集的cassandra节点上使用vnodes吗?谢谢。Datastax hadoop节点基础

回答

4

在Datastax Enterprise中,您还在运行Cassandra的节点上运行Hadoop。最常见的部署是制作两个数据中心(节点的逻辑分组)。一个数据中心专门用于分析,包含同时运行Hadoop和C *的计算机,另一个数据中心仅C *,并且服务器的OLTP功能为你的群集。 Analytics节点上的C *进程连接到群集的其余部分(与任何其他C *节点一样),并在写入突变时接收更新,以便最终与数据库的其余部分保持一致。数据既存在于这些节点上,也存在于群集中的其他节点上。再次,大多数人最终都有一个NetworkTopologyStrategy的复制模式,它在他们的C++中只指定了几个副本,在他们的AnalyticsDC中指定了一个副本,但是你的用例可能会有所不同。两个数据中心中的节点数量不必相同。

对于第二个问题,是的,您可以在仅支持C *的数据中心中启用Vnodes。另外,如果您的批处理作业的大小足够大,您还可以在分析数据中心中运行vnodes,但只会造成轻微的性能下降。这又是完全基于你的用例。如果您希望有更快的更短的分析作业,您不希望在Analytics(分析)数据中心中启用vnodes。