4
在YARN上运行Spark,集群模式。纱YARN上的Spark:执行没有worker的驱动程序
- 3数据节点
- YARN => 32个vCores,32 GB RAM
我提交火花方案是这样的:
spark-submit \
--class com.blablacar.insights.etl.SparkETL \
--name ${JOB_NAME} \
--master yarn \
--num-executors 1 \
--deploy-mode cluster \
--driver-memory 512m \
--driver-cores 1 \
--executor-memory 2g \
--executor-cores 20 \
toto.jar json
我可以看到2个作业在2个节点上运行良好。但是我还可以看到另外两个只有驱动程序容器的工作!
是否有可能无法运行驱动程序,如果没有对工人的任何资源?