我试图将我的reducer的结果输出到多个文件。数据结果全部包含在一个文件中,其余结果根据其尊重文件中的类别进行分割。我知道0.18,你可以用MultipleOutputs做到这一点,它并没有被删除。但是,我试图使我的应用程序0.20+兼容。现有的多输出功能仍然需要JobConf(我的应用程序使用Job和Configuration)。如何根据密钥生成多个输出?使用Hadoop生成多个输出文件0.20+
4
A
回答
9
对MultipleOutputs的支持不在0.20中。您将需要使用旧的API。
它已被添加到0.21当前未发布为org.apache.hadoop.mapreduce.lib.output.MultipleOutputs。
This thread在邮件列表中讨论了这个问题。
2
您可以做这在Hadoop 0.20,只是如上所述,你必须使用旧的API。
有一些很粗糙的代码,这样做在 http://github.com/orngejaket/Info_Moist_1_Splicer/tree/master/src/contrib/streaming/src/java/org/infochimps/hadoop/mapred/lib/
产生的罐子每个记录写入到它(消毒)键后命名的文件。
相关问题
- 1. 使用Hadoop Pig生成多个输出
- 2. 从Hadoop中的映射器生成多个输出文件MapReduce
- 3. XslTransform.Transform生成多个输出文件
- 4. 多个输出HADOOP
- 5. Hadoop映射器可以在输出中生成多个键吗?
- 6. 在Hadoop流中生成单独的输出文件
- 7. 使用RequireJS的优化器和单个构建文件生成多个输出
- 8. hadoop作业输出文件
- 9. 使用phantom.js生成多个HAR文件
- 10. Xcode中的警告:“输出文件的多个生成命令”
- 11. 是否可以为map-reduce生成多个输出文件?
- 12. 从模板生成多个输出文件
- 13. 的iOS SDK(xcodebuild联编):生成多个输出文件
- 14. TesseractOCRiOS |警告:输出文件的多个生成命令
- 15. 生成文件:有3种输入产生一个输出
- 16. Hadoop PIG输出没有在PARALLEL运算符中被拆分成多个文件
- 17. Hadoop - 使用Java将reducer输出合并到单个文件中
- 18. 写在多个文件输出在Hadoop中
- 19. XSLT生成多输出
- 20. Hadoop只生成一个减速器输出
- 21. 使用多列数据生成单个数字输出
- 22. Hadoop MapReduce - 每个输入的一个输出文件
- 23. 如何使用输入文件名与Rake生成输出文件名?
- 24. Hadoop的多路输出
- 25. 从输出生成xml文件
- 26. webpack不生成输出文件
- 27. 如何设置Hadoop Streaming作业生成的输出文件的块大小?
- 28. 如何使用XSLT通过读取和处理多个输入xml来生成一个输出xml文件
- 29. HADOOP - 作为映射器输出产生的输出文件的数量
- 30. Apache Ant仅使用log4j将输出生成为文件
这令人难以置信的令人沮丧和愚蠢。这似乎是该计划中需要的基本功能。 – monksy 2010-02-02 04:37:08
是的。很多工作正在朝向具有1.0的正确API接口发展。 – 2010-02-02 16:45:07
如果使用cdh distrubution,则不行。 cdh3是0.20.1加上一些修补与MultipleOutputs类。我最初不愿意使用cdh并使用apache distro。但是,在几个问题之后,对cdh更加满意。 – smartnut007 2011-05-27 23:22:22