1
我在远程集群上运行YARN下的Spark安装,并在我和头节点之间有防火墙。我可以用一个ssh
隧道接入到头节点:通过SSH隧道连接到通过YARN运行的Spark
> ssh -N -f -L 10000:remotenode:10000 between_machine
与此设置的作品,例如,访问HiveServer2上remotenote
运行。如果星火在集群模式下运行,我需要做的只是在7077端口相同,直接pyspark
客户localhost
与
> ssh -N -f -L 7077:remotenode:7077 between_machine
> ./pyspark --master spark://localhost:7077
我如何能做到这一点星火纱线调度下运行?
谢谢。端口4040是连接到远程pyspark的端口还是仅用于webui?我需要远程提交作业,而不是访问webui。 – Ivan