0
我有一个通过qubole运行的pyspark作业,失败时显示以下错误。在qubole上的pyspark作业失败,并显示“重试异常读取映射器输出”
Qubole > Shell Command failed, exit code unknown
Qubole > 2016-12-03 17:36:53,097 ERROR shellcli.py:231 - run - Retrying exception reading mapper output: (22, 'The requested URL returned error: 404 Not Found')
Qubole > 2016-12-03 17:36:53,358 ERROR shellcli.py:262 - run - Retrying exception reading mapper logs: (22, 'The requested URL returned error: 404 Not Found')
作业运行具有以下配置:
--num-executors 38 --executor-cores 2 --executor-memory 12288M --driver-memory 4000M --conf spark.storage.memoryFraction=0.3 --conf spark.yarn.executor.memoryOverhead=1024
集群包含30个奴隶计数。 m2.2xlarge
,4核心主从节点。
任何有关问题根源的见解都会有用。
无论你读什么似乎都不可用。 – ksindi