继续问题:What is the difference between partitioning and bucketing a table in Hive ?蜂巢桶vs分区
假设我们已通过Salary列对员工表进行分区。如果我们使用基于salary列的where子句中的条件从此表编写select查询,那么查询将运行得很快......因为它只会从特定分区获取细节。
但是,如果我们根据薪水栏和固定桶数设置相同的表格,而不是分区。那么在这种情况下,如果我们编写相同的查询,我想知道该查询如何从桶中受益?任何人都可以解释吗?