2011-12-20 54 views
1

对于一个非常狭窄的问题,我们需要一些现有的解决方案:一次写入多次读取时间序列存储。我们关心针对大型数据集的分布式复制二进制存储

属性是:

  • 低读取延迟
  • 复制
  • 可扩展性(能够添加更多资源在物理硬件或金钱)

我们尝试了谷歌的AppEngine数据存储以〜1M blob分块。不幸的是,读取延迟和定价并不令人愉快。

选项,我们要考虑的是:

  • 亚马逊的SimpleDB
  • HDFS/HBase的我们自己的托管
  • 一些NoSQL的品种(东京暴君?)在MySQL
  • 的BLOB(手动分拆必须完成)

我们错过了什么吗?我们应该考虑其他选项还是优先考虑其他选项?

回答

2

您可能还想看看微软的Azure Storage服务。它们以合理的价格提供blob,表(非关系)和队列。

3

尝试光泽和或Ceph。两者都有(或将有)商业支持。