1

我看到Impala 2.3仅在上面的Cloudera CDH 5.5 &上受支持。 Impala 2.2可以安装在Amazon EMR上,因为GitHub &上提供了Bootstrap脚本,您不需要安装Cloudera。在Amazon EMR上安装Impala 2.3

但是,我没有看到任何方式在Amazon EMR上安装Cloudera CDH 5.5或5.6。我想安装Impala 2.3,因此可以通过哪种方式在Amazon EMR上安装Impala 2.3?

回答

0

不,不可能在EMR上“安装”任何东西,因为它是由AWS提供的PaaS。但是,如果您的目标是在AWS上运行更新版本的Impala,则可以使用AWS Quick Start路径来安装CDH 5.x(包括Impala),从而使该过程变得相对容易。

http://aws.amazon.com/quickstart/

+2

这不提供问题的答案。要批评或要求作者澄清,请在其帖子下方留言。 - [来自评论](/ review/low-quality-posts/12063382) –

+1

缺少什么信息? –

+0

我只想知道,有什么方法可以在Amazon EMR上安装Impala的最新版本?谢谢 –

1

嗯,我以前的答案已经只要删除,因为“不提供问题的答案。”我不打算争论是否对这个问题有一个部分不正确的答案,或者如果没有基础的绝对索赔是一个很好的答案:/。

在任何情况下,我不会放弃:)

是的,这是可能的安装在纸上“什么”

启动EMR群集后,所有实例都将显示在您的EC2控制台上。唯一的一点是你必须小心地分配正确的权限来通过SSH访问你的实例。我的建议是创建一个具有访问权限的特定安全组,并使用群集的高级配置将此额外安全组分配给实例。 通过正确的配置,你可以SSH入任何实例并安装任何东西(如果你有正确的VPC配置,你应该能够从任何文件上下载任何文件或下载)。请注意,用户将是“hadoop”而不是“ec2-root”,但这在EMR用户指南中有记录。

请记住,群集是“Terminated”,因此EMR实例是易失性的,并且安装不会在群集终止后继续存在。另一方面,使用最新版本的EMR AMI和AWS的最新功能(我认为它始终是这种情况,但现在无关紧要),您应该能够创建一些在bootstrap上执行任何操作并安装任何你想要的东西。

使用群集的“高级配置”,您可以访问要在群集上执行的“引导”操作。您甚至可以根据节点类型(主,核心,任务)采取不同的操作。您应该将脚本(和/或jar文件)存储在S3存储桶中,并将该存储桶用于群集。在本文中,您可以在包含EMR集群的这些EC2实例上安装Impala,但我不确定这是否可行。

欲了解更多信息,可以阅读http://docs.aws.amazon.com//emr/latest/ManagementGuide/emr-plan-bootstrap.html

而对于以前版本的EMR AMI的和不那么最近的黑斑羚的版本,你可以阅读https://github.com/awslabs/emr-bootstrap-actions/tree/master/impala

感谢马克,你逼我详细越好我的评论。