0
我正在开发一个监视每个执行程序性能的火花程序,例如当一个执行程序开始工作时以及完成其工作时标记。我正在考虑两种方式来做到这一点:Spark程序来监视执行程序的性能
首先,开发程序,这样当执行程序开始工作时,它将当前时间标记为文件,当它结束时,将该时间标记为同一文件。最后,除了驱动程序机器之外,所有“日志”文件都将散布在整个集群网络中。其次,由于执行者会定期向驾驶员报告,每次驾驶员收到来自执行者的消息时,如果消息包含“开始”和“完成”信息,让驾驶员记录一切。
这可能吗?
Spark日志记录系统已经做到了这一点。 – Tim
在这里看到这个东西。 Spark已经有这样的东西:http://spark.apache.org/docs/latest/monitoring.html –