1
我运行查询,并希望评估性能(执行IME) 我的尝试:绩效评估
t0 = time.time()
df =sqlContext.sql(query)
df.count()
t1 = time.time()
我可以肯定的是,查询完成,T1-T0是查询运行时间?
我运行查询,并希望评估性能(执行IME) 我的尝试:绩效评估
t0 = time.time()
df =sqlContext.sql(query)
df.count()
t1 = time.time()
我可以肯定的是,查询完成,T1-T0是查询运行时间?
在IBM Analytics for Apache Spark上,在您的笔记本中,转到“调色板”并选择“环境”。在那里你可以看到一个指向Spark History Server的链接,你可以在其中调查你的Spark工作。
对于每个Spark作业列出计算时间。
鉴于这段特定的代码?不可以。有些数据可以从缓存中获取,它不能解释依赖关系(可以缓存,从零开始载入),并且包括与客户端的通信。 Spark UI可能是一个更好的检查地点。 – zero323