2009-11-05 77 views
2

我想使用HBase作为商店,我可以推送格式为{document => {term => weight}}的数百万条目,例如“将词语X插入到具有重量Z的文档Y中”,然后发出诸如“为该文档选择前1000条款”或“为每个文档选择前1000条款”的命令。这适用于我当前的MySQL实现,但也许该域更适合HBase。我注意到HBase和BigTable用于全文索引,这是一个类似的问题域。这是一个合适的(或可能的)HBase的用法吗?

你可以告诉我,我已经不只是阅读HBase上的几页了,但我希望你能理解我的问题的要点。这与this question有关。

可能的障碍可能包括HBase不允许使用与LIMIT子句等价的查询。鉴于我想查询重量,我想联想{weight => term},这将是两个具有相同权重(我假设HBase只允许唯一键)的术语有问题。或者,我将不得不为一个给定重量存储一组条款,但这会限制我准确限制退货条款数量的能力。

回答

0

简单的回答是的。

更复杂的答案,现在这些“没有sql”数据存储每个实现他们自己的程序员接口,而“无sql”意味着他们不是基于SQL的。因此,准备一些编码,但没有困难。大多数这些数据存储都是名称值对存储,通过REST或SOAP获取(HBase也有列家族的概念)。他们所做的是Map Reduce,这是一个非常有趣的查询领域,值得一读。

相关问题