2017-01-03 560 views
0

我在4个不同的列上创建了一个包含布隆过滤器的配置单元表,并稍后决定使用alter命令添加更多。何时在Hive表上创建布隆过滤器?

但我不知道如何刷新/重新生成Hive上的布隆过滤器。

插入数据期间是否创建了布隆过滤器?

当我们收集统计数据时是否创建?列或表级别?

还是我完全不了解我对bloom滤波器的理解,它是在飞行中创建的?

我已阅读文档,并没有找到关于此的更多信息。尝试通过代码没有运气,并找到方法触发的地方。

回答

0

你可以这样做Hive 0.10.0和更高版本使用ANALYZE TABLE命令更新STATISTICS。

即。

ANALYZE TABLE Table1 COMPUTE STATISTICS FOR COLUMNS; 
+0

我试过这样做,但我的查询性能似乎没有变化,日志不显示任何更少的行正在处理,当我期望有很大的差异。有没有我可以检查过滤器使用的尺寸数据的地方,以确认这一点? –

+1

检入Metastore数据库表。 –

+0

感谢,似乎工作。 –