2016-12-30 74 views
1

我对Hadoop非常陌生,并试图使用this运行一个简单的程序。Hadoop 2.7.3 Streaming Jar无效

我抄本地实例数据HDFS,但在我的地图缩小,当我运行此命令按照Apache官方文档

hadoop jar hadoop-streaming-2.7.3.jar \ 
-input /user/hduser/gutenberg/* \ 
-output /user/hduser/gutenberg-output \ 
-mapper /home/hduser/mapper.py \ 
-reducer /home/hduser/reducer.py 

我收到此错误

工作不是有效的JAR:/usr/lib/hadoop-streaming-2.7.3.jar

请尽量帮助我。

回答

2

它正在使用Hadoop 2.7.3

以下是你需要运行

[Linux的] $ Hadoop的罐子在/ usr /本地/ Hadoop的/股/ Hadoop的/ tools/lib目录/ Hadoop的命令-streaming-2.7.3.jar -file /home/python/mapper.py /home/python/reducer.py -mapper“python mapper.py”-reducer“python reducer1.py”-input/tmp/word_i -output/tmp/word_output

相关问题