0
我到我所用FSDataOutputStream.writeInt写在我的代码整数HDFS上的一个文件()如何读取包含写入的整数一个Hadoop文件
如何从命令行工具的Hadoop读它? hadoop dfs -cat返回二进制垃圾。
我到我所用FSDataOutputStream.writeInt写在我的代码整数HDFS上的一个文件()如何读取包含写入的整数一个Hadoop文件
如何从命令行工具的Hadoop读它? hadoop dfs -cat返回二进制垃圾。
直接从命令行使用hadoop fs
的一些混合物 - 除非您想深入研究通过awk脚本输出输出,否则不太可能。
你可以只写一个简单的Java类读取该文件,我猜是这样的:
public class IntFileReader extends Configured implements Tool {
public static void main(String[] args) throws Exception {
ToolRunner.run(new IntFileReader(), args);
}
public int run(String[] args) throws Exception {
FileSystem fs = FileSystem.get(getConf());
FSDataInputStream is = fs.open(new Path(args[0]));
while (is.available() != -1) {
System.out.println(is.readInt());
}
is.close();
return 0;
}
}
然后你就可以在一个罐子捆绑并执行:
hadoop jar myJar.jar IntFileReader /path/to/file/in/hdfs