2011-04-16 87 views
1

在3节点hadoop集群中。我希望主人是1节点。 Map任务发生在一个节点中,并减少1个节点中的任务。地图和减少任务应该分开。可能吗?据我注意到,两个一起运行。如果你能说出一些亮点,那将是非常棒的。谢谢 !分离Hadoop映射并减少任务

-Sethu

回答

4

这一切不是最优的,因为其他的地图输出必须始终复制到另一台服务器。
但是,您可以简单地修改服务器上的mapred-site.xml。

<property> 
    <name>mapred.tasktracker.map.tasks.maximum</name> 
    <value>4</value> 
    <description>The maximum number of map tasks that will be run simultaneously by a task tracker.</description> 
</property> 

<property> 
    <name>mapred.tasktracker.reduce.tasks.maximum</name> 
    <value>4</value> 
    <description>The maximum number of reduce tasks that will be run simultaneously by a task tracker.</description> 
</property> 

在没有减速器运行的服务器上,您将放入reduce.task.maximum为零。反之亦然,对于其他服务器。

+1

嗨,我应该提到地图任务的最大数量总是?它是不够的,如果我强行指定 mapred.tasktracker.reduce.tasks.maximum 减少将同时由任务跟踪器运行的最大任务数。 ,在只有地图任务应该运行的节点,反之亦然,只有减少的节点应该运行? – sethu 2011-04-16 19:08:37

+0

嗨,我不确定默认是什么(它可能是内核的数量),所以只需提供这两个值。试试看。 – 2011-04-16 19:57:20

+0

您的意思是默认的map/reduce任务数量可能是基于系统中处理器的数量? – sethu 2011-04-17 01:09:15