2014-10-29 102 views
0

我是Hadoop/Mahout的新手,我理解这些概念,但是我遇到了将Mahout作业部署到已经设置的计算机集群的问题。在集群上部署Mahout作业

我在单台计算机上使用了Mahout,但是我应该怎么做才能使其运行到已经形成的Hadoop集群?

我有一个安装了Hadoop 0.20.2的群集,以及包含Hadoop 1.2.1的Mahout 0.9。我应该复制哪些jar文件,以便可以运行包含Mahout调用的代码,或者我应该如何使其在Hadoop集群上运行?

任何建议/示例/教程将是伟大的。

感谢

回答

0
+0

谢谢您的回答,抱歉迟到的回应。只是为了检查,所以如果设置了$ HADOOP_HOME和$ HADOOP_CONF_DIR,那么作业在群集上运行,否则它在本地机器上运行?而且,如果我有装有Mahout的1.2.1版本的Hadoop jar,并且在群集上安装了0.20.2,mahout作业将使用安装的0.20.2版本的Hadoop运行?有没有办法检查作业是否在群集上运行?再次感谢。 – Marko 2014-11-04 08:44:06