我有一个应用程序需要针对不同级别的聚合进行分析,这就是OLAP工作负载。我也想经常更新我的数据库。任何可扩展的OLAP数据库(Web应用程序规模)?
例如,这里是我的更新是什么样子(架构是这样的:时间,DEST,源IP,浏览器 - >访问次数)
(15:00-1-2-2010, www.stackoverflow.com, 128.19.1.1, safari) --> 105
(15:00-1-2-2010, www.stackoverflow.com, 128.19.2.1, firefox) --> 110
...
(15:00-1-5-2010, www.cnn.com, 128.19.5.1, firefox) --> 110
然后我要问什么是WWW的总访问.stackoverflow.com从上个月的Firefox浏览器。
我知道Vertica系统可以以相对便宜的方式来执行此操作(性能和可扩展性明智,但不是成本明智的)。我在这里有两个问题。
1)有没有一种开源产品可以用来解决这个问题?特别是,Mondrian系统的工作效果如何? (可伸缩性和性能) 2)是否有HBase或Hypertable基础解决方案(显然,裸体HBase/Hypertable不能这样做)? - 但是如果有一个基于HBase/Hypertable的项目,可扩展性可能不会成为IMO的问题)?
谢谢!
您的预期数据量是多少?每天点击100万次?千万? – 2010-01-21 09:23:42