2016-04-29 64 views
1

我设置了一个运行Apache Aurora框架的Mesos集群,并且我注册了100个cron作业,每分钟运行一个5个从属机器池。我排定100次后发现,cron作业堆叠处于“PENDING”状态。请问我可以检查什么样的日志以及可能存在的问题? enter image description hereApache Aurora cron作业未安排

回答

2

这可能是一个几件事情:

  • 你仍然有足够的资源在集群中?
  • 这些资源是否提供给极光?或者也许只有到另一个框架?
  • 您是否有任何限制您的任务的任务?

可能的信息来源:

  • 是什么工具提示或扩张状态在UI上说什么? (如屏幕截图所示)
  • Aurora调度程序具有日志文件。然而,通常这些对于最终用户来说不需要为什么东西卡在悬而未决中。

如果你被困在这里,它可能是freenode上#aurora IRC频道最好的选择。

+0

这是所有伟大的建议。我会补充一件事:如果您需要更直接的帮助,请随时通过我们的IRC频道下载:#aurora on irc.freenode.net或订阅Aurora用户列表(更多详情,请访问:http: //aurora.apache.org/community/)。 –

+0

感谢您的建议。 1.首先,可执行文件是一个非常简单的程序,它打开文件并编写一个数字。我认为集群中有足够的资源,因为我总共拥有40个CORE和40 GB内存。我想知道如果我可以看看日志,看看是否有资源问题。 2. Aurora是Mesos上运行的唯一框架 3.没有任务约束 扩展“状态”后,它说“一分钟前 - 挂起”。我想知道在哪里可以找到Aurora日志?/var/log/aurora?没有什么有趣的。 –

+0

框架是否以可达的IP地址运行,即不是127.0.0.1? Mesos Master日志说什么? – Tobi