2011-12-23 92 views
5

我需要在数据库中存储大约1亿条记录。其中约60-70%将每天删除,每天插入相同数量的记录。我感觉像Hbase这样的文档数据库,Big Table会适合这个。还有许多其他的数据存储,如Cassandra,MongoDb等。对于这类问题,哪种数据存储会很有用,因为每天会有大量的读/写操作(数十万的数量级)。最佳数据存储大量数据读写

+0

也许你想要一个效率比较。你可以在他们的网站上看到每一个数据存储的表现。我们使用卡桑德拉类似的情况,但我没有与其他数据存储玩 – Nishant 2011-12-23 08:14:32

+0

你的数据的性质可能影响这个数据库比较以及 – Prescott 2011-12-23 08:21:23

+0

许多数据存储可以处理1亿条记录和这些读取/删除率。记录的大小是多少?什么是你的数据访问模式等写入与读取比例等? – 2011-12-24 13:24:00

回答

3

根据您所提到的特性(JSON文件,访问由按键100万条记录,均衡的读取/写入)我会说CouchDBMembase是较好的选择(这里是一个quick comparison

两个HBase的Cassandra也可以工作,但对于HBase,你需要安装很多你不会真正使用的组件(Hadoop,ZooKeeper等),只有当你有更多的写入而不是读取时,Cassandra才会更好(至少是上次我用它)。

大桌子,不幸是谷歌内部:)