2016-02-12 82 views
0

Folk,给定色谱柱系列的SSTtable编号

我们试图评估CASSANDRA作为生产应用之一。我们很少有基本的疑问,我们希望在继续之前了解。

写:

卡桑德拉使用一致性哈希机制跨节点均匀分布的关键。因此,某些Cassandra节点上将提供一些密钥。

我们进一步了解,将会创建内部SSTTable结构来存储节点中的这些数据。

READ:

在执行一个读客户端将发送请求到任何卡桑德拉节点群集和基于一致散列卡桑德拉将确定的键位于哪个节点上。

以下情况不明确。

1)有多少SSTTables对于给定的密钥空间/列族创建的节点上(是它的一些固定数或仅1)

2)卡桑德拉文档描述,有一些扫帚滤波器(替代标准哈希),用于确定给定密钥是否存在于SSTtable中(如果有1000个SST表,将会有1000个布隆过滤器将被检查以确定密钥是否存在)

回答

0

1)稳定数量取决于压实策略和负载。要想一个想法检查出log structured merge trees有一个基本的理解,然后看看不同的压实策略(大小分层,水平,日期分层)。

2)是的,每个sstable有一个bloom过滤器给出该sstable中存在的分区的概率成员资格。布隆过滤器的大小取决于分区数量和目标误报百分比。他们不在堆中,而且一般都很小,现在比以前的版本更少关注现在的问题。

检出发电机和大表格文件可能有助于理解集群和存储背后的原理。读/写路径上有很多免费资源,并且在堆栈溢出问题中完全过多,所以我建议通过datastax academy或某些YouTube上的演示文稿的某些材料。