2
我的数据看起来像每帧10万个数值(真实+二进制)(想想数组,即数组的一行中有1000万个元素),并且大约有100个帧/第二。一种时间序列。数值数据 - 高容量+高速度+快速检索
对我的挑战是:
(1)存储 - 数据
量(2)数据的处理速度
(3)实时分析
是卡桑德拉合适为了这?任何人都可以在应用程序体系结构(Think hadoop,cassandra,kafka,storm等)上引导我一点,这将在上面的场景(从非常高的层面来看)中解决。
我知道我问过一些很大的东西。在实验之前,我需要一个方向。
感谢您的分享。您能否更详细地说明您将如何实时集成Hadoop + Storm?你是否建议有两个独立的部分 - 实时风暴和Hadoop的批处理? – Suman 2013-05-13 21:36:09