2012-07-13 66 views
0

我读两套目录标记特定的输入文件(假设迪拉和污垢)作为输入到我的MapReduce作业,我需要以不同的标记它们以某种方式使在映射阶段我知道是从哪里来的。有什么建议?如何从不同的目录

回答

2

您可以使用MultipleInputs进行调查,并为每个输入路径定义一个不同的映射器,或者检查输入拆分(Context.getInputSplit() - 将其转换为FileSplit并获取路径)并相应地调整输出。