我想了解一个示例hadoop项目。它具有以下的代码块如何为SequenceFileInputFormat定义映射函数的键和值输入?
jconf.setOutputKeyClass(Text.class);
jconf.setOutputValueClass(Text.class);
jconf.setInputFormat(SequenceFileInputFormat.class);
从this link,我读到为SequenceFileInputFormat,键和值是用户定义的。我需要为此实现RecordReader吗?我没有看到它在项目中实施。是否有任何默认分隔符用于将输入分割分割为键值对?
谢谢Esawara! “序列文件中的键和值在创建时决定。”问题是如何?有没有一个默认的分隔符用于识别密钥,我没有用于项目运行的样本输入,但是从我在代码中看到的内容看来,期望密钥成为文件的路径。 – learningtocode 2013-03-08 11:17:00
这里没有分隔符的概念。无论作为创建序列文件的作业的输出发出的输出键和值都将自动用作后续作业中的输入键和值。 – 2013-03-10 10:14:08