我想知道在哪里存储由cassandra提供的数据。 就像一个“数据湖”,在那里我可以放置所有处理过的数据,在一天结束时或类似的东西。与apache cassandra一起使用的最佳数据存储文件系统?
我正在寻找可以防止丢失数据的分布式可靠存储解决方案。
Cassandra的文件系统名为CFS,但在哪里存储?
我想知道在哪里存储由cassandra提供的数据。 就像一个“数据湖”,在那里我可以放置所有处理过的数据,在一天结束时或类似的东西。与apache cassandra一起使用的最佳数据存储文件系统?
我正在寻找可以防止丢失数据的分布式可靠存储解决方案。
Cassandra的文件系统名为CFS,但在哪里存储?
Cassandra以实时异步复制的形式构建了弹性。在大多数情况下,在EXT4,ZFS等之外拥有任何类型的特殊文件系统都可能导致Cassandra世界出现问题。
大多数用户依赖Cassandra的复制,尽管有些用户也选择合并备份,他们倾向于上传到云存储或单独的mnt点。
如果您的意思是您想从Cassandra获取数据并将其存储在其他位置(如数据盘),我建议使用Spark从Cassandra有效地批量读取数据,然后写出到平面文件或系统你的选择。
老,但对整体卡桑德拉性能有很大的文章,并有一个关于文件系统会议(搜索文件系统部分):
https://tobert.github.io/pages/als-cassandra-21-tuning-guide.html
在卡桑德拉,丢失数据的最好的保护是一个高复制因子和快照。