2013-04-29 40 views
1

我跟随Hadoop in Action开始使用ec2的hadoop。我在Ubuntu上运行并下载并安装了最新版本的Hadoop。我打一个路障在这个命令:开始使用hadoop和ec2的最新版本

hadoop-ec2 launch-cluster mycluster 2 

书中说“Hadoop的EC2工具在目录 的src /的contrib/EC2 /你的Hadoop安装目录下仓回想一下,我们的 ec2-init.sh脚本已经添加该目录到您的系统 路径中的目录是Hadoop的EC2,这是 执行其他命令的Meta命令来启动Hadoop集群在EC2上使用:。

Hadoop的EC2推出集群<群集名称> <数的奴隶>


我得到的回应是:hadoop-ec2: command not found

我注意到变量$HADOOP_HOME未设置。

看起来这本书已经过时。

  1. 有人可以指导我在过去几个月创建的教程,如何设置与ec2 hadoop?
  2. 经过一些快速的谷歌搜索,似乎HADOOP_HOME已弃用。这是真的?
  3. 我能够没有问题地执行ec2-describe-images。并获取我可以使用的所有可用图像。 hadoop-ec2命令为什么不起作用?

谢谢你的指导。

回答

1

不幸的是,专用页面Running Hadoop on Amazon EC2(实际上并不方便HADOOP_HOME)事实证明本身已过时,并且似乎不再适用于最新的稳定版本(1.0.4时本文)。我不知道更新过的本地教程,但显然用户很满意通过Apache Whirr(其中在2007年作为Apache Hadoop中的一些bash脚本在EC2上运行Hadoop集群)。

因此有一个Getting Started with Whirr™可用,此外也有相关的第三方教程,如:

我希望你能够合并关于使用Apache Hadoop的书中有关通过Apache Whirr运行Hadoop集群的信息 - 祝你好运!

+0

非常感谢您的善意信息!可以请你告诉我最新版本的hadoop(我已经安装)hadoop主目录在哪里? – 2013-04-29 20:34:50

+0

我做了这个sudo find/-wholename'* hadoop/bin *'并没有结果! – 2013-04-29 20:56:01