我有一个表格,其中包含以下列。Hive根据时间戳选择最新值的数据
C1,C2,Process TimeStamp,InsertDateTimeStamp
p1,v1,2014-01-30 12:15:23,2013-10-01 05:34:23
p1,v2,2014-01-31 05:11:34,2013-12-01 06:12:31
p1,v3,2014-01-31 07:16:05,2012-09-01 07:45:20
p2,v4,2014-02-01 09:22:52,2013-12-01 06:12:31
p2,v5,2014-02-01 09:22:52,2012-09-01 07:45:20
现在,我想根据最新Process TimeStamp
获取每个主键的唯一行。
如果Process TimeStamp
是相同的,则应该选择具有最新的InsertDateTimeStamp
的行。
所以,我的结果应该是。
p1,v3,2014-01-31 07:16:05,2012-09-01 07:45:20
p2,v4,2014-02-01 09:22:52,2013-12-01 06:12:31
如何通过HiveQL实现此目的?
我目前使用配置单元0.10。我不能在IN或EXISTS中使用子查询。
谢谢。
谢谢。它的工作:) – jigarshah