2016-02-12 80 views
1

我运行查询,并希望评估性能(执行IME) 我的尝试:绩效评估

t0 = time.time() 
df =sqlContext.sql(query) 
df.count() 
t1 = time.time() 

我可以肯定的是,查询完成,T1-T0是查询运行时间?

+0

鉴于这段特定的代码?不可以。有些数据可以从缓存中获取,它不能解释依赖关系(可以缓存,从零开始载入),并且包括与客户端的通信。 Spark UI可能是一个更好的检查地点。 – zero323

回答

1

在IBM Analytics for Apache Spark上,在您的笔记本中,转到“调色板”并选择“环境”。在那里你可以看到一个指向Spark History Server的链接,你可以在其中调查你的Spark工作。

对于每个Spark作业列出计算时间。