我正在研究简单的地图缩减程序。我想在缩减器之后为密钥中的每个不同的单词创建不同的文件。例如,在执行的MapReduce后,我有这样的事情减速器中的多个输出
优先级为1×2
优先级为1 Y 2
优先级为1 Z 2
优先级2×2
优先级2 Y 2
现在在缩小阶段之后,我想要不同的文件,并根据优先级说明Priority1和Priority2具有所有这些值。我正在使用java,并想知道这种输出应该写在reducer中吗?
我只是想知道这是甚至可能或者如果是如何处理或解决这个问题? 我正在使用Hadoop 0.20.203,因此多输出不起作用。
任何指针都会有帮助。 感谢您的帮助! Atul
特别是当您创建输出格式时,您如何处理为每个单词创建新文件?通常情况下,输出文件是在调用OutputFormat.getRecordWriter(context)时创建的,所以如何知道如何命名文件? – Huckle 2012-07-02 22:30:43