提前道歉,因为我是新来的火花。我创建了一个具有4个工作站的独立模式的Spark集群,并且在成功配置工作站属性后,我想知道如何配置主属性。在火花集群中配置主节点
我写一个应用程序,并使用它SparkSession.builder连接到集群(我不希望它使用火花提交提交。)
我知道,工人可以在conf/spark-env.sh
文件中配置并具有可以设置的参数,如'SPARK_WORKER_MEMORY'和'SPARK_WORKER_CORES'
我的问题是:如何配置主设备的属性?因为此文件中没有“SPARK_MASTER_CORES”或“SPARK_MASTER_MEMORY”。
我想过在spark-defaults.conf
文件中设置这个,但是它似乎只用于spark-submit。
我想过在应用程序中使用SparkConf().set("spark.driver.cores", "XX")
来设置它,但是这只能指定应用程序使用的内核数量。
任何帮助将不胜感激。
谢谢。
如果你不想使用火花提交你怎么打算将作业提交到集群? – dumitru
我的脚本在一个连接到火花簇的jupyter笔记本中。 – msharky