对于大约1个月,我在我的Cassandra集群中看到以下3个节点的使用空间值(我有复制因子= 3)nodetool cfstats output :Cassandra cfstats:Live和Total已用空间值之间的差异
Pending Tasks: 0
Column Family: BinaryData
SSTable count: 8145
Space used (live): 787858513883
Space used (total): 1060488819870
对于其他节点我看到良好的价值观,是这样的:
Space used (live): 780599901299
Space used (total): 780599901299
你可以注意到Live和总面积之间有25%的差异(〜254Gb)。看起来我在这3个节点上有很多垃圾,因为某些原因无法压缩。 列家人我说的是有100兆的大小的SSTable配置LeveledCompaction策略:
create column family BinaryData with key_validation_class=UTF8Type
and compaction_strategy=LeveledCompactionStrategy
and compaction_strategy_options={sstable_size_in_mb: 100};
注意,即总价值在所有三个节点为一个月住。我依靠Cassandra自动标准化数据。
我试图降低空间(无结果):
- nodetool清理
- nodetool维修-PR
- nodetool紧凑[KEYSPACE] BinaryData(没有任何反应:主要压实的LeveledCompaction战略忽视)
有没有其他的事情我应该尝试清理垃圾和可用空间?
你在本月的时间段内是否执行了大量的删除操作? – abhi 2013-05-03 10:38:23
我想是的,我没有一个精确的值,它可能会在100Gb-1Tb之间的数据被删除。但为什么我的群集中只有3个节点存在此问题?为什么群集中其余节点具有Live == Total?我正在使用Cassandra 1.1.9 – odiszapc 2013-05-03 13:46:41