我知道Twissandra这是一个使用Cassandra的twitter克隆的示例,但我有兴趣查看是否有人共享Cassandra架构不是为了克隆Twitter,而是用于存储通过Twitter发送的推文流媒体API?Apache Streaming API的Apache Cassandra数据架构
1
A
回答
6
这很大程度上取决于您在摄入数据后想要对数据进行什么样的查询 - 我从您之前的问题“转储Twitter流式API推文...”中看到,您可能只是想要进行大批量处理在上面。
如果是这种情况,您只需要担心负载平衡,确保集群中的每个节点处理写入负载的1/n,并且包含1/n数据 - 使用随机分区并插入每鸣叫一行与状态ID为行键将实现这一目标。
但是,如果你想要做像“给我一个给定用户的所有微博”的查询,您将需要一个稍微复杂的模式,如上文所建议的架构将要求您扫描所有的数据。你可以每行插入多鸣叫,行键为用户ID,列键为鸣叫ID和作为鸣叫价值。然后,您可以使用get_slice来回答该查询。
好(有点关系)的博客文章:http://blog.insidesystems.net/basic-time-series-with-cassandra
相关问题
- 1. apache spark Streaming error
- 2. Apache Cassandra或DataStax Cassandra?
- 3. Apache Cassandra磁盘上的数据存储
- 4. 使用apache flink读取和写入cassandra的数据Java API
- 5. Apache Cassandra读取数据给出ReadFailureException
- 6. Apache Ignite-Cassandra集成,数据重复?
- 7. java.lang.NoClassDefFoundError:org/apache/spark/streaming/kafka/KafkaUtils
- 8. Apache Ignite和Cassandra - NoClassDefFoundError
- 9. UTF8Type与ByteType的Apache Cassandra的
- 10. 更新架构的数据帧中的Apache星火
- 11. Apache Cassandra启动问题
- 12. Apache Cassandra JDBC连接错误
- 13. 在Apache Cassandra中添加列
- 14. IBM InfoSphere与Apache Cassandra集成
- 15. Apache Spark Streaming失败的集成测试
- 16. 如何在DynamoDB流中使用Apache Streaming
- 17. Spark Streaming + Hbase:NoClassDefFoundError:org/apache/hadoop/hbase/spark/HBaseContext
- 18. Apache POI Streaming API无法识别Excel(xlsx)内容
- 19. apache spark streaming - kafka - 阅读旧信息
- 20. Apache Spark SQL从Cassandra中获取数十亿行数据?
- 21. 为Apache Mahout使用Cassandra数据模型的示例
- 22. 检索Apache Spark中的Cassandra分区数据
- 23. Apache Cassandra中的财务数据分析建模?
- 24. Apache Cassandra作为ActiveMQ的消息数据存储
- 25. Flex 4.5/Apache Flex UI框架结构
- 26. Apache Ignite适用于NoSQL架构
- 27. Apache Metamodel与Apache Drill
- 28. Apache Phoenix API for PHP
- 29. Apache Apex与Apache Flink
- 30. 的Apache Cassandra的3.10抛出:IllegalArgumentException - 为Murmur3Partitioner
你对此有何更新吗?你有没有对你有用的计划? – felipeclopes
我放弃卡桑德拉和HBase的使用,而不是用自定义模式 –