2017-02-12 61 views
0

如果我想长时间运行EMR集群,之后我想设置数据管道在集群上做某些事情,我该怎么做?在长时间运行的EMR集群上设置AWS数据管道

我必须在此EMR集群上安装Task Runner?或者,也许任务亚军将预装?或者也许有其他简单的方法?

回答

2

Task Runner未预先安装在EMR中。必须手动配置它,请按照这些steps在EMR群集中安装Task Runner。

启动Task Runner过程时,请提供--workerGroup的名称。该名称将成为此EMR群集的标识符,可用于数据传送活动中的WorkerGroup字段。

+0

Bootstrap Action可以做到吗? – lubom

+0

是的,您可以将这些步骤添加为脚本并将其用于引导操作。 – franklinsijo

+0

你可以发布你的bootstrap吗?我有WAITING_FOR_RUNNER状态。 – lubom