我们使用“System Lag”来检查我们Dataflow作业的健康状况。例如,如果我们看到系统滞后时间的增加,我们将尝试看看如何降低这个指标。有关这一指标的问题很少。GCP数据流:从Pub/Sub IO流式传输的系统延迟
- 1)系统滞后究竟意味着什么?
数据的项目一直在等待处理
上面的最大时间是我们在GCP控制台看到,当我们打到信息图标。在这种情况下,数据项意味着什么?流处理具有窗口的概念,事件时间与处理时间,水印等的概念。什么时候被考虑等待处理的项目?例如,简单地说,当消息到达时,无论其状态如何?
- 2)该度量的最佳阈值是多少?
我们尽量保持这一指标尽可能低,但我们并没有建议我们应该保持多低。例如,我们是否有一些建议,如保持系统在20到30之间滞后是最佳的。
- 3)如何系统的滞后拖累汇
如何系统的滞后影响事件本身的延迟?