i使用aws云中的datastax dse启动集群spark cassandra。所以我的数据集存储在S3中。但我不知道如何从S3传输数据到我的群集cassandra。请帮我如何从S3导入数据集到cassandra?
0
A
回答
1
细节取决于你的文件格式和C *的数据模型,但它可能是这个样子:
从S3文件读入到一个RDD
VAL RDD = SC .textFile( “S3N://mybucket/path/filename.txt.gz”)
操控RDD
写RDD到卡桑德拉表:
rdd.saveToCassandra( “测试”, “KV”,SomeColumns( “键”, “值”))
1
相关问题
- 1. 从cassandra导入数据到solr
- 2. 如何将流数据集写入Cassandra?
- 3. 如何导出Cassandra群集中的数据并导入另一个
- 4. 在cassandra中导出/导入数据
- 5. 无法使用Sqoop将数据从Vertica导入到Cassandra
- 6. 如何将数据从Cassandra导出到BigQuery
- 7. 如何将SnowFlake S3数据文件导出到我的AWS S3?
- 8. 如何将数据从BigQuery导出到S3?
- 9. 从数据集导出数据到excel
- 10. 从Spark中导入长行到Cassandra
- 11. 从“混合”数据集导入数据到MySQL
- 12. 格式问题与从数据集数据导入到Excel表
- 13. 如何导入/解析收集数据?
- 14. 如何导入大型数据集?
- 15. 将Freebase导入到cassandra中
- 16. 如何从mongodb导出数据子集
- 17. 将Amazon S3文件导入数据库
- 18. 如何从csv文件导入数据到数据库中?
- 19. Cassandra使用cqlsh从远程CSV导入数据COPY
- 20. Python:如何从ggplot中排除数据集导入?
- 21. 将大数据集迁移到s3
- 22. 导入OData数据集
- 23. 将数据集导入ContextBroker
- 24. 将数据集导入neo4j
- 25. Cassandra数据模型指导
- 26. 将Cassandra数据库集群从AWS迁移到Azure
- 27. 如何导入从记事本/电子表格数据集到Matlab GUI
- 28. 如何将consul集群数据备份到S3存储
- 29. 如何将流数据写入S3?
- 30. 从SQL服务器导入海量数据集到HDF5