这里是Hadoop的新手。当作业以超级模式运行时,ApplicationMaster不会从ResourceManager请求容器。相反,运行在单个节点上的AM只是在其自己的进程上执行整个作业。这是有利的,因为它减少了必须处理RM的开销。Hadoop中超级模式的用途是什么?
我不明白:如果一个工作足够小,可以在一个节点上合理的时间内完成,那么首先提交MapReduce作业有什么意义? MapReduce允许在多台机器上并行执行计算,从而加快了计算速度。如果我们只打算使用一个节点,那么为什么不写一个常规程序并在我们的本地机器上运行呢?