我已经使用ElasticMapReduce一段时间了。这很方便,但我无法运行HBase,因为Hadoop集群只是暂时可用(我在HBase and Hadoop问了一些相关的问题)。EC2上的Hadoop与ElasticMapReduce/S3
所以我想尝试在一组EC2机器上安装Hadoop。我知道Hadoop有一些与EC2相关的目录 - src/contrib/ec2。看起来Hadoop集群可以简单地通过输入命令启动,我可以登录到主节点以运行作业等等。在尝试这个之前,我想知道一直使用它的ppl的一些细节。谢谢!
好问题,很想看到一些答案。我知道Elastic MapReduce使用S3作为存储平台,所以它通常比EC2上的Hadoop效率低,因为它不能像使用HDFS(s3在不同系统上运行)那样使用数据区域优化。 – Christophe 2012-03-30 19:31:17