2011-12-13 76 views
2

我想构建一个跨越多节点的B +树计算机网络(Linux PC的内部子网)
弹性海量存储。范围扫描很重要。分布式网络B +树

这是否基本上是
分布式数据库系统的底层数据结构? (Cassandra,HBase)

有没有关于分布式B +树的研究?
我看到这篇文章在
http://www.cs.yale.edu/homes/aspnes/papers/opodis2005-b-trees-final.pdf
但跳过B树只取故障节点出来(所以有数据丢失)

我在B +树有特别感兴趣内置冗余
(即,如果一主机发生故障时,所有的节点是主机处于脱机状态,
我想另一个复制的主机成为主节点
服务器,并采取故障主机的地方)

我不想使用集合的DB插件对于大规模存储系统(跨商品
x86,带有FOSS OS的x64硬件),分片并不是一个好选择
(1节点,一个DB)

我重新发明了车轮吗?
我应该只使用Cassandra或HBase?

回答

2

Cassandra支持范围查询。

当您打开机器时,Google的Big Table会自动将新机器添加到群集。这是非常有弹性,容易添加更多的机器。不幸的是,它的速度有一个缺点:查询非常有限。你可以做一些范围查询。请参见本文列表和更多的细节:http://geothought.blogspot.com/2009/04/google-app-engine-and-bigtable-very.html

一个很好的例子数据是如何存储在大表:http://jimbojw.com/wiki/index.php?title=Understanding_Hbase_and_BigTable

一个不错的堆栈溢出后: storing massive ordered time series data in bigtable derivatives