2016-03-07 78 views
0

我们使用Hive(v.1.2.1)在accumulo(v。1.7.1)表上使用“sql like”进行读取。Hive对Accumulo推荐的设置

是否有任何特殊设置,我们可以在配置单元或某处获得我们的性能或稳定性?

如果我们以这种方式使用配置单元,有没有任何一点例如尝试一些配置单元索引或诸如“hive.auto.convert.join”之类的设置,或者它的工作方式不同并且在这些情况下不会影响?

谢谢!

回答

0

强制性:我写了(大部分)AccumuloStorageHandler,但我绝不是Hive专家。

您可能会发现的最大收获是,您可以通过可以修剪行空间的方式来构造查询(通过WHERE子句中的rowid映射列上的语句) 。据我所知,没有太多(任何?)查询优化被推入Accumulo本身。

根据您的工作量,您可以使用Hive在Accumulo中生成自己的“索引表”。如果您可以创建一个自定义表格,并且您想要主动查询存储在Accumulo行中的列,那么您的查询应该运行得更快。