当我尝试在Apache Mahout中运行示例时，此错误告诉我们什么？

我学习使用Apache Mahout中，并运行它的例子之一后收到以下消息：当我尝试在Apache Mahout中运行示例时，此错误告诉我们什么？

Exception in thread "main" org.apache.hadoop.mapreduce.lib.input.InvalidInputException: Input path does not exist: file:/home/user1/workspace/LDAAnalysis/output/data

事实上，*/output/data目录被发现在此创建运行后。我不明白这个错误信息告诉我们什么？

来源

2011-06-15 bit-question

我想你必须提供比这更多的信息？它通常意味着您指定的输入目录不正确。特别是我猜测它需要成为HDFS路径。 – 2011-06-16 08:15:32

肖恩，谢谢你的回复。我对Hadoop不熟悉，并且正在尝试使用单节点学习Mahout。根据你的说法，我仍然需要在Hadoop中设置路径，即使是在一个普通的Linux机器上。我的理解是否正确？ – 2011-06-16 14:09:20

第一个大问题是“什么样的”？有些将在当地工作，有些则不会。我认为这是LDA相关的，但会说非常有帮助。或者打印更多的堆栈跟踪。

这不仅仅是正确书写路径的问题。你必须建立正确的目的地。从您的评论我不确定您是否设置了Hadoop或者HDFS是否正在运行或您已经输入了哪些内容。

来源

2011-06-16 14:43:11

感谢您的回复。我尝试运行的java文件与examples/src/main/java/orga/apache/mahout/clustering/syntheticcontrol/dirichlet/job.java完全一样。我没有在我的linux机器上安装hadoop。 hadoop是运行mahout所必需的。我运行displayDirichlet.java，它工作得很好。 – 2011-06-16 19:26:05

命令行如何？输入是问题，但不清楚你的输入是什么。 – 2011-06-16 20:41:31

我也怀疑输入数据没有正确的格式。我正在努力使其中一个。在我看来，Mahout文档在这方面不是很清楚。你能给我任何建议吗？或者是否有任何公开可用的数据集，它与Mahout兼容，并且可以下载？我只是想测试。 – 2011-06-17 18:42:51

当我尝试在Apache Mahout中运行示例时，此错误告诉我们什么？

回答

相关问题