我需要为Hadoop MapReduce应用程序实现自定义(服务)输入源。我google'd和SO'd,发现一种方式继续是实现一个自定义InputFormat。那是对的吗?Hadoop MapReduce InputFormat已弃用?
显然根据http://hadoop.apache.org/common/docs/r0.20.2/api/org/apache/hadoop/mapred/InputFormat.html已弃用InputFormat的方法getRecordReader()和getSplits()。什么是替代品?
Hadoop的字计数例如仍然使用相同的...
你的问题实际上是在不同版本之间。 `0.20.2`(最新的稳定版本)的大部分问题是它明确弃用功能而没有版本内替换。 `MultipleOutputs`和`org.apache.hadoop.mapred`几乎全部都是这种情况。这似乎表明了我一直在关注的API的重大重组。 (回答即将出现,一旦我编译了足够的源代码信息。) – MrGomez 2010-12-08 05:01:07