2011-06-15 43 views
1

我学习使用Apache Mahout中,并运行它的例子之一后收到以下消息:当我尝试在Apache Mahout中运行示例时,此错误告诉我们什么?

Exception in thread "main" org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: file:/home/user1/workspace/LDAAnalysis/output/data 

事实上,*/output/data目录被发现在此创建运行后。我不明白这个错误信息告诉我们什么?

+0

我想你必须提供比这更多的信息?它通常意味着您指定的输入目录不正确。特别是我猜测它需要成为HDFS路径。 – 2011-06-16 08:15:32

+0

肖恩,谢谢你的回复。我对Hadoop不熟悉,并且正在尝试使用单节点学习Mahout。根据你的说法,我仍然需要在Hadoop中设置路径,即使是在一个普通的Linux机器上。我的理解是否正确? – 2011-06-16 14:09:20

回答

1

第一个大问题是“什么样的”?有些将在当地工作,有些则不会。我认为这是LDA相关的,但会说非常有帮助。或者打印更多的堆栈跟踪。

这不仅仅是正确书写路径的问题。你必须建立正确的目的地。从您的评论我不确定您是否设置了Hadoop或者HDFS是否正在运行或您已经输入了哪些内容。

+0

感谢您的回复。我尝试运行的java文件与examples/src/main/java/orga/apache/mahout/clustering/syntheticcontrol/dirichlet/job.java完全一样。我没有在我的linux机器上安装hadoop。 hadoop是运行mahout所必需的。我运行displayDirichlet.java,它工作得很好。 – 2011-06-16 19:26:05

+0

命令行如何?输入是问题,但不清楚你的输入是什么。 – 2011-06-16 20:41:31

+0

我也怀疑输入数据没有正确的格式。我正在努力使其中一个。在我看来,Mahout文档在这方面不是很清楚。你能给我任何建议吗?或者是否有任何公开可用的数据集,它与Mahout兼容,并且可以下载?我只是想测试。 – 2011-06-17 18:42:51

相关问题