1
可能重复:
What is the most network efficient method of fetching a set of rows in HBase?在HBase中,除了一组给定的行之外,最有效的网络获取方法是什么?
说,我有一组行键的(一组)。除了这个集合中的行之外,为所有行提取特定列族的最有效的网络方法是什么?
可能重复:
What is the most network efficient method of fetching a set of rows in HBase?在HBase中,除了一组给定的行之外,最有效的网络获取方法是什么?
说,我有一组行键的(一组)。除了这个集合中的行之外,为所有行提取特定列族的最有效的网络方法是什么?
如果该集合与总行数相比较小,则只需获取全部并在客户端代码中进行过滤。 hbase扫描程序非常高效,并具有可配置的结果缓存缓冲区以减少RPC调用。
您可以过滤返回给客户端的集合,但是这个集合将被发送到所有节点,因此这些数据的网络流量将在可能保存数据的节点数量上相乘。
您可以为每个键的扫描添加一个过滤器。
byte[] key = // ...
scan.setFilter(new RowFilter(CompareFilter.NOT_EQUAL, new BinaryComparator(key)));
确实,我可以这样做 - 我试图弄清楚这些行甚至不会发送到客户端的方式。 – gurjeet
我在扫描对象中看不到filterRow调用。是最近添加的还是它是一个自定义分支? – gurjeet
抱歉我的电线穿过api。 –