创建从给定的开始和结束日期的顺序排列我有ID的数据表,开始和结束为列,如:在HIVE
ID |开始| end
1 | 2011-01-01 | 2011-01-03
2 | 2011-02-13 | 2011-02-14
什么,我想在HIVE做的是天的全范围添加为一个单独的列的数组,所以我想获得:
ID |开始|结束|范围
1 | 2011-01-01 | 2011-01-03 | ['2011-01-01','2011-01-02','2011-01-03']
2 | 2011-02-13 | 2011-02-14 | ['2011-02-13','2011-02-14']
我试图使用collect_set(),但无法让它工作。你有什么建议吗?谢谢!
在你的数据集天的范围,或者你需要基于'start'和'端生成它们'? – gobrewers14
@ GoBrewers14我需要根据开始和结束首先生成它们,然后将它们插入到新列中。 – Ado