2015-09-20 74 views
0

有没有办法从reducer收集输出并防止写入文件?我想在写入文件之前对减少的输出进行排序。有没有办法从hadoop中收集reducer的输出?

+0

您能否提供更多信息,比如Reduce的输入,Reducer的输出以及您想要排序的键或值是什么? – YoungHobbit

+0

@JRR,减速机的输出已经按键排序。你可能需要什么排序? – sureshsiva

回答

0

不,没有办法做到这一点。 MapReduce作业必须将结果写入文件。

如果我理解正确,您想以某种方式对reducer输出进行排序,而不是通过传递给reducer的键进行默认排序。

您有这2点可能的方式:在地图上期

  1. 更改输出键,另外一个通过你的数据 应该简化阶段进行排序。
  2. 如果第一种方式是不可能的,您可以 排序reducer输出另一个MapReduce作业或不同的工具。 您可以从指定主作业的输出目录的相同 驱动程序的主作业之后开始将作业分拣为排序作业的输入目录 。
相关问题