我试着在使用EMR的Spark群集上运行一个作业。该集群有一个主站和两个从站,每个节点(主站或从站节点)有32个内核。该作业通过控制台使用“添加步骤”,配置设置如下:如何使用EMR使从属节点适用于Spark群集?
sparkConf.setMaster(“local [24]”).set(“spark.executor.memory”,“40g”) 。 set(“spark.driver.memory”,“40g”);
然后我注意到两个从站不工作(CPU使用率接近0),只有主人正在努力工作。我如何解决这个问题,并使奴隶工作?
谢谢!
嗨,我需要设置sparkConf.setMaster(“yarn-cluster”)吗?或者不要设置任何东西,并且./bin/spark-submit - 主纱线集群会照顾它?谢谢! – Edamame 2015-02-12 17:33:19
请勿使用sparkConf.setMaster。使用 - 主管纱群参数 – pzecevic 2015-02-13 09:46:41