日期,时间范围内丢失记录我的形式如何创建的Pig Latin
2013-07-09T19:17Z,f1,f2
2013-07-09T03:17Z,f1,f2
2013-07-09T21:17Z,f1,f2
2013-07-09T16:17Z,f1,f2
2013-07-09T16:14Z,f1,f2
2013-07-09T16:16Z,f1,f2
2013-07-09T01:17Z,f1,f2
2013-07-09T16:18Z,f1,f2
的输入记录这些代表时间戳和事件。我手写这些,但实际数据应该根据时间进行排序。
我想生成一组记录,这些记录将被输入到需要连续时间序列的图形绘图功能中。我想填写缺失值,即如果有“2013-07-09T19:17Z”和“2013-07-09T19:19Z”的条目,我想为“2013-07-09T19:18Z”生成条目“与预定义值。
我就这样做的想法:
- 使用MIN和MAX找到该系列中的开始和结束日期
- 写UDF这需要最小值和最大值,并返回一个缺少 关系时间戳
- 加入以上2个关系
我不能让我的头在如何实施这个在PIG虽然。将不胜感激任何帮助。
谢谢!