2014-12-19 73 views
1

我意识到创建一个要发送给reducer的关键排序列表是mappers的主要目标。然后,如果列表非常大,则需要在映射器中进行分区,以便可以由reducer处理(我的意思是对于唯一键值列表非常大,然后需要进行分区),但为什么hadoop需要排序映射器中的键。有人问我这个问题,我无法完全说服他。我只是一个初学者,有点好奇。任何帮助表示赞赏。为什么Hadoop Mapper会对数据进行排序?

回答

0

排序发生在映射阶段之后,执行减速作业之前,您不需要明确地进行排序。

请参考similar question

相关问题