2013-04-07 48 views
0

我需要根据特定列的值中的子字符串将HBase数据库中的行分组。在HBase中检索具有唯一子字符串的行

该列中的值的格式是这样的:

[text1]_[text2]_[text3] 

实施例:

row1: abc_aaa_ababab 
row2: abc_aaa_cdcdcd 
row3: abc_bbb_fgfgfg 
row4: def_ccc_ababab 
row5: hij_ccc_jkjkjk 

如何列出的[文本2]的所有可能值(例如AAA,BBB和CCC) ?

我不需要一次检索每一行的所有列。用户会看到各种[text2],当他选择“bbb”时,只有“bbb”的行才会被检索到。我想我可以使用FuzzyRowFilter来完成后面的部分。

但我不确定如何列出[text2]的值。可以通过使用现有的过滤器,也许是自定义过滤器或不同的方法来完成吗?

注意:数据库模式是由客户创建的 - 改变它是可能的,但是一个繁琐的过程。因此,与使用概述模式相比,重新设计模式的建议是有价值的,但是次要的。

回答

0

使用此模式将会非常低效,因为您需要每个搜索的全表扫描。

我想添加一个表格,将所有可能的子字符串映射到行ID