我的作业有多个输入路径。例如:确定块属于Hadoop中的哪个文件路径
//Driver.class
for (String s : listFile) {
MultipleInputs.addInputPath(job, new Path(s), SequenceFileInputFormat.class);// ex: /home/path1, /home/path2, ...
}
.....
//Mapper.class
public void map(Text key, Data bytes, Context context) throws IOException, InterruptedException {
.....
}
我的问题是有没有办法来确定地图()函数当前对(键,值)属于哪个文件?
您可以从'configure(JobConf)'方法的'JobConf'中提取文件路径。参见javadocs中的示例:https://hadoop.apache.org/docs/r2.6.3/api/org/apache/hadoop/mapred/Mapper.html。 – gudok