我想使用HBase作为商店,我可以推送格式为{document => {term => weight}}
的数百万条目,例如“将词语X插入到具有重量Z的文档Y中”,然后发出诸如“为该文档选择前1000条款”或“为每个文档选择前1000条款”的命令。这适用于我当前的MySQL实现,但也许该域更适合HBase。我注意到HBase和BigTable用于全文索引,这是一个类似的问题域。这是一个合适的(或可能的)HBase的用法吗?
你可以告诉我,我已经不只是阅读HBase上的几页了,但我希望你能理解我的问题的要点。这与this question有关。
可能的障碍可能包括HBase不允许使用与LIMIT
子句等价的查询。鉴于我想查询重量,我想联想{weight => term}
,这将是两个具有相同权重(我假设HBase只允许唯一键)的术语有问题。或者,我将不得不为一个给定重量存储一组条款,但这会限制我准确限制退货条款数量的能力。