我还是新的hadoop
,我试图让this example工作。hadoop streaming无效的DFS目录名称
我能够安装hadoop并运行wordcount
mapreduce
示例,一切都很好。但是我得到一个java.lang.IllegalArgumentException: Invalid DFS directory name
异常,当我使用hadoop 2.6.0
这里运行windows 7
一个hadoop
streaming command
是我的命令:
hadoop jar %HADOOP_PREFIX%\share\hadoop\tools\lib\hadoop-streaming-2.6.0.jar -mapper mapper.php -reducer reducer.php -input input/* -output output
如果我跑比如从文件夹中的命令d:\hadoop
显示错误变为:
java.lang.IllegalArgumentException: Invalid DFS directory name /d:/hadoop
输出目录是在错误显示并且作业失败之前创建的。
我试图搜索命令来设置分布式文件的位置,但我没有找到类似的东西。
任何意见,将不胜感激。
谢谢Ramesh,但我仍然得到相同的错误。我确信这些文件是在hdfs路径中添加的,当我运行“hadoop dfs -ls”时,我可以看到它们列出,并且确保输入文件相对于hdfs路径设置。但我仍然无效的路径,它打印当前目录我在尝试给输入文件的错误路径,它给出了一个不同的错误,所以它看到我的输入文件。我想这意味着它是别的东西? –
您是否可以使用上述注释中执行的所有步骤更新您的问题?所以我可以看看细节。 “hadoop-streaming-2.6.0.jar”是你创建的吗? –
不,我下载了一个已经编译好的windows hadoop文件,它有所有jar文件,包括wordcount示例和流媒体jar。我没有真正添加任何额外的步骤,我只是确保输入和输出路径是hdfs路径,正如您指出的 –