2015-10-07 46 views
0

创建从给定的开始和结束日期的顺序排列我有ID的数据表,开始和结束为列,如:在HIVE

ID |开始| end

1 | 2011-01-01 | 2011-01-03

2 | 2011-02-13 | 2011-02-14

什么,我想在HIVE做的是天的全范围添加为一个单独的列的数组,所以我想获得:

ID |开始|结束|范围

1 | 2011-01-01 | 2011-01-03 | ['2011-01-01','2011-01-02','2011-01-03']

2 | 2011-02-13 | 2011-02-14 | ['2011-02-13','2011-02-14']

我试图使用collect_set(),但无法让它工作。你有什么建议吗?谢谢!

+0

在你的数据集天的范围,或者你需要基于'start'和'端生成它们'? – gobrewers14

+0

@ GoBrewers14我需要根据开始和结束首先生成它们,然后将它们插入到新列中。 – Ado

回答