0
我有一个Spark应用程序,它在运行时基于数据集缓存RDD并执行操作。缓存中有多少RDD Spark
为了监控目的,我希望在应用程序运行时找出缓存中RDD的数量,Spark是否提供任何API来查找此详细信息?
我有一个Spark应用程序,它在运行时基于数据集缓存RDD并执行操作。缓存中有多少RDD Spark
为了监控目的,我希望在应用程序运行时找出缓存中RDD的数量,Spark是否提供任何API来查找此详细信息?
它可以使用Spark REST API它提供了两个端点:
/applications/[app-id]/storage/rdd
- 所有存储RDDS的名单。/applications/[app-id]/storage/rdd/[rdd-id]
- 特定RDD的详细信息。它在我的本地开发环境中工作。但在我的黄金/铂金环境中,spark线程服务器安装在纱线上:(是否有其他选择? –
@ zero323。这个解决方案只适用于当我想在同一应用程序中获取缓存rdd。但我想在单独的程序/应用程序中找到缓存RDD。 –