2013-05-14 261 views
-1

我不知道怎么回事,却突然从我的hadoop reducer我的输出文件包含了一堆,我从来没有把它放在字符中的前几行是这样的:。hadoop的输出文件乱码

SEQ^F!org.apache.hadoop.io.LongWritable^Yorg.apache.hadoop.io.Text^@^@^@^@^@^@ 
<99><F1>a^O)(|7me<EB><C0><FB><E0><B2><E2>^@^@^@f^@^@^@^H^@^@^@^@^@^@^@^@]0 1.4593640091648059E-6 30 303761 30 303747 33 341837 30 303746 30 303743 30 312703 30 303759^@^@^@<8B>^@^@^@^H^@^@^@^@^@^@^@^@<8F><81>1 

有人可以帮忙吗?

在此先感谢

+0

locale问题?只是猜测。 – Bill 2013-05-14 03:00:04

+1

只是想出来。这是FileOutputFormat ....我不小心复制了错误的格式 – 2013-05-14 03:09:07

回答

1

这是一个二进制序列文件,那你解释为文本。前3个字符是'幻数',表示它是一个序列文件。然后,您可以看到键和值类型(LongWritable和Text),接着是序列文件块标题,然后是键/值对(全部为二进制编码)块。