我目前正在为SaaS近实时分析应用程序测试Redshift。 在100M行数据集上查询性能很好。Amazon Redshift for SaaS应用程序
但是,当更多用户同时使用应用程序时,每个群集15个查询的并发限制将成为问题。
我不能缓存对所有的结果,因为我们授权自定义每个查询过滤器(即席查询)
该应用程序的要求是:
- 查询必须10S 内返回结果
- 使用超过100列的过滤器进行临时查询
- 从1到50个客户端同时连接到应用程序
- 数据集牛逼增长在10M行/天的速度
- 典型的查询是SELECT与聚合函数COUNT,AVG有1或2加入
红移是不正确的这种使用情况?你会考虑哪些其他技术来满足这些要求?
你确定允许直接查询数据是正确的吗?为了使查询运行更快,是否无法创建一些专门的事实或汇总表? – bstempi