我想将大的CSV文件加载到我的cassandra集群(此时为1个节点)。cassandra sstableloader使用各种分区键从csv加载数据
基础上:http://www.datastax.com/dev/blog/using-the-cassandra-bulk-loader-updated
我的数据是由CQLSSTableWriter转化为SSTables文件,然后我用SSTableLoader来加载SSTables到卡桑德拉表已经包含一些数据。
该CSV文件包含各种分区键。
现在让我们假设使用多节点cassandra cluser。
我的问题:
1)是我在多节点集群的情况下使用正确的加载过程?
2)SSTable文件是否会被SSTableLoader分割并发送给负责特定分区键的节点?
谢谢
您的CSV文件有多大? – 2015-01-27 07:47:49
让我们假设我的CSV有100 * 10^6行 - 我的意思是它是一个非常大的文件,不推荐使用CQLSH COPY命令(如下所述:http://www.datastax.com/documentation/cql/ 3.1/cql/cql_reference/copy_r.html) “COPY FROM用于将小数据集(几百万行或更少)导入到Cassandra中。要导入更大的数据集,请使用Cassandra批量加载程序。 – 2015-01-27 10:35:21
我使用Cassandra v2.0.11 – 2015-01-27 10:53:25