为什么Hadoop Mapper会对数据进行排序？

我意识到创建一个要发送给reducer的关键排序列表是mappers的主要目标。然后，如果列表非常大，则需要在映射器中进行分区，以便可以由reducer处理（我的意思是对于唯一键值列表非常大，然后需要进行分区），但为什么hadoop需要排序映射器中的键。有人问我这个问题，我无法完全说服他。我只是一个初学者，有点好奇。任何帮助表示赞赏。为什么Hadoop Mapper会对数据进行排序？

来源

2014-12-19 Akshay Hazari

排序发生在映射阶段之后，执行减速作业之前，您不需要明确地进行排序。

请参考similar question

来源

2014-12-19 05:36:59 Sandy

为什么Hadoop Mapper会对数据进行排序？

回答

相关问题