我是新来的火花。现在我可以在纱线上运行0.9.1(2.0.0-cdh4.2.1)。但执行后没有日志。YARN上的Spark日志在哪里?
以下命令用于运行火花示例。但是,在正常的MapReduce作业中,在历史记录服务器中找不到日志。
SPARK_JAR=./assembly/target/scala-2.10/spark-assembly-0.9.1-hadoop2.0.0-cdh4.2.1.jar \
./bin/spark-class org.apache.spark.deploy.yarn.Client --jar ./spark-example-1.0.0.jar \
--class SimpleApp --args yarn-standalone --num-workers 3 --master-memory 1g \
--worker-memory 1g --worker-cores 1
我在哪里可以找到logs/stderr/stdout?
有没有设置配置的地方? 我发现从控制台输出一句话:
14/04/14 18时51分52秒INFO客户:命令为ApplicationMaster:$ JAVA_HOME /斌/ java的-server -Xmx640m -Djava.io.tmpdir = $ PWD/tmp org.apache.spark.deploy.yarn.ApplicationMaster --class SimpleApp --jar ./spark-example-1.0.0.jar --args'yarn-standalone'--worker-memory 1024 - 工人芯1 --num工人3 1> <LOG_DIR> /标准输出2> < LOG_DIR>/stderr的
在这一行,通知1> $LOG_DIR/stdout 2> $LOG_DIR/stderr
哪里可以设置LOG_DIR?
这是只有在'yarn-site.xml'中'yarn.log-aggregation-enable'为'true'并且应用程序已经完成时才为true。 – thSoft
如何在代码中获取纱线上的applicationId? – nish1013
集群安全时,这不起作用。 – Sohaib