我有大约500个传感器,每个传感器每分钟发出一次值。可以假定传感器的值保持不变直到发射下一个值,从而创建时间序列。传感器在发射数据时不同步(因此观测时间戳变化),但它们都是集中收集并存储在每个传感器中(以允许按子集传感器进行过滤)。传感器汇总时间序列
我该如何生成一个汇总时间序列,其中给出传感器数据的总和? (需要创建1天以上观测值的时间序列 - 因此需要考虑每天24x60x500观测值)。计算也需要很快,最好在< 1秒内运行。
示例 - 原始输入:
q)n:10
q)tbl:([]time:n?.z.t;sensor:n?3;val:n?100.0)
q)select from tbl
time sensor val
----------------------------
01:43:58.525 0 33.32978
04:35:12.181 0 78.75249
04:35:31.388 0 1.898088
02:31:11.594 1 16.63539
07:16:40.320 1 52.34027
00:49:55.557 2 45.47007
01:18:57.918 2 42.46532
02:37:14.070 2 91.98683
03:48:43.055 2 41.855
06:34:32.414 2 9.840246
我要找应该表现出同样的时间戳输出,和整个传感器的总和。如果传感器没有在匹配的时间戳处定义记录,则应该使用先前的值(记录仅暗示传感器输出发生变化时的时间)。
预计输出,通过时间
time aggregatedvalue
----------------------------
00:49:55.557 45.47007/0 (sensor 0) + 0 (sensor 1) + 45.47007 (sensor 2)
01:18:57.918 42.46532/0 (sensor 0) + 0 (sensor 1) + 42.46532 (new value on sensor 2)
01:43:58.525 75.7951 /33.32978 + 0 + 42.46532
02:31:11.594 92.43049/33.32978 + 16.63539 + 42.46532
02:37:14.070 141.952 /33.32978 + 16.63539 + 91.98683
03:48:43.055 91.82017/33.32978 + 16.63539 + 41.855
04:35:12.181 137.24288/78.75249 + 16.63539 + 41.855
04:35:31.388 60.388478/1.898088 + 16.63539 + 41.855
06:34:32.414 28.373724/1.898088 + 16.63539 + 9.840246
07:16:40.320 64.078604/1.898088 + 52.34027 + 9.840246
感谢您的快速回复,但没有得到正确的输出。我更新了预期产出的问题。我有大约3年的数据价值,所以也需要看看splaying/partitioning。 – 2013-05-04 10:34:31
刚刚更新了我的答案。正如我所提到的,可能有更有效的方法以矢量形式进行此操作。 – user1895961 2013-05-05 14:20:20
好的,这给出了正确的输出。很遗憾,没有抵达订单的保证(只有大致的时间订单) – 2013-05-05 17:36:41