我正在构建一个完整的“向外扩展”解决方案,以向我们的客户提供深入的实时分析。Hadoop和分析?
客户主要拥有多达200台服务器,每台服务器最多有400个会话正在进行,同时提供80000个会话。 我希望我可以提供会话分析,并使用BI工具(例如Tableau)提供图形和查询界面(基本上汇总查询)。
我希望每个会话都是4分钟长,并在4分钟内触发20个事件。每个事件可以是大约5个字段,主要是整数。我会在会话期间记录开始日期,结束日期以及基本上一些计数器(例如点击次数)。这是每秒约8000插入。
我虽然关于Hadoop,因为RDBMS显然不会很容易扩展(如果你说服我,PostgreSQL可以在5000-8000美元的机器上处理这个负载)将会使用PostgreSQL。
但是,我读过Hadoop具有太多延迟,因为它是面向批处理的,所以它可能不适合分析。你怎么看 ?
网络营销行业用于提供数据库和查询的解决方案是什么?
谢谢!
石墨看起来不错,但不适合分析材料(过滤器/连接...)。无论如何感谢您指出! – SCO