2013-04-10 59 views
0

我必须在hadoop 1.0.4许多(也许12个)作业中运行。我希望第一个并行运行,当所有完成并行运行4个其他作业并最后再次运行最后3个并行运行时。我如何在hadoop 1.0.4中设置它,因为我发现所有作业都互相运行而不是并行运行。并行映射减少Hadoop中的作业

+0

使用oozie http://oozie.apache.org/ – banjara 2013-04-10 12:07:16

回答

2

JobControl API可用于MR作业依赖性。对于复杂的工作流程,推荐使用OozieAzkabanHere是Oozie与Azkaban,

+0

在我的情况下,我可以用户的JobControl,这似乎很容易被使用? – 2013-04-10 13:13:25

+0

使用JobControl API必须使用命令job.waitForCompletion(true);每个作业结束后还是从JobControl自动完成? – 2013-04-11 10:54:38

+1

我有消息工作在状态RUNNING而不是DEFINE – 2013-04-11 10:57:27