2012-04-03 73 views
4

我想要在地图中计算类似的值,其中key将是Hive表列中的值,对应的值是计数。在Hadoop Hive中计数

例如,如下表所示:

+-------+-------+ 
| Col 1 | Col 2 | 
+-------+-------+ 
| Key1 | Val1 | 
| Key1 | Val2 | 
| Key2 | Val1 | 
+-------+-------+ 

所以蜂巢查询应该返回类似

Key1=2 
Key2=1 

回答

9

看起来你正在寻找一个简单的组。

SELECT Col1, COUNT(*) FROM Table GROUP BY Col1

+0

有没有办法做第二级别的分组。我实际上只将上述输出作为分组查询。 – divinedragon 2012-04-05 14:42:39

+0

你的意思是由2列组成?您可以将多个列放在组中。 – 2012-04-05 19:16:32