7
A
回答
5
有控制的重试次数(即ApplicationMaster
注册尝试与纱线的最大数量被认为失败,并因此整个火花应用)两个设置:
spark.yarn.maxAppAttempts
- Spark自己的设置。见MAX_APP_ATTEMPTS:private[spark] val MAX_APP_ATTEMPTS = ConfigBuilder("spark.yarn.maxAppAttempts") .doc("Maximum number of AM attempts before failing the app.") .intConf .createOptional
yarn.resourcemanager.am.max-attempts
- YARN自己设置默认为2。
(正如你在YarnRMClient.getMaxRegAttempts看到)的实际数量的纱和星火的配置设置最低YARN是最后的选择。
2
财产yarn.resourcemanager.am.max-attempts
添加到您的纱default.xml中的文件。它指定了最大的应用程序尝试次数。
详情调查此link
相关问题
- 1. Spark作业第一次尝试失败连接到oracle
- 2. 如何在多次重试后调试映射作业失败的原因
- 3. laravel queue(重试作业5次)并将作业标记为失败“手动”
- 4. Spark作业失败,退出状态15
- 5. 由于java.lang.NoSuchMethodException,Spark作业失败:org.apache.hadoop.hive.ql.metadata.Hive.loadDynamicPartitions
- 6. 由于InvalidClassException,Spark Kafka Streaming作业失败
- 7. 所有后台作业失败,达到最大同时作业限制 - 解析
- 8. 限制失败的登录尝试次数
- 9. 如何在作业失败时触发laravel作业失败()方法?
- 10. Spark Direct Stream并发作业限制
- 11. 超过了重试次数10.失败
- 12. 如何在Jenkins作业失败时调试“java.io.IOException并且无法删除作业”
- 13. 作业失败
- 14. Sidekiq - 重新安排失败的作业
- 15. 由于目录级别上的权限问题导致Spark作业失败
- 16. 如何检查Resque中最后一次失败的作业?
- 17. 如果作业失败,spark-submit.sh返回0
- 18. Oozie作业失败
- 19. Gradle作业失败
- 20. Oracle作业失败
- 21. SolrIndexerJob:java.lang.RuntimeException:作业失败:
- 22. 如何使用新的生产Rails代码使失败的sidekiq作业重试?
- 23. 当Browsesttack中的Nightwatch测试断言失败时,失败了Jenkins作业
- 24. 无法部署本地Spark作业,工作者因EndPointAssociationError失败
- 25. Hangfire重复作业失败,未提及
- 26. 由于ClosedChannelException引发的Spark作业失败(DFSOutputStream.checkClosed)
- 27. 为什么Spark作业在“hadoop:not found”的Mesos上失败?
- 28. 在oozie中使用hive上下文失败的Spark作业
- 29. 是否有可能恢复失败的Apache Spark作业?
- 30. 如何限制同时运行PBS作业的数量
不错!我一直在梦想着能够看到应用程序尝试增加的用例。你知道是什么原因造成的吗? –
由于缺少内存和“超出GC开销限制”问题,导致容器分配失败时发生了这种情况。 – codingtwinky