2015-03-18 57 views
0

我一直在EMR上试验Impala,在我看来,它只使用集群中的核心节点,而不是任务节点。cloudera impala可以使用EMR中的任务节点吗?

我使用EMR提供的内置Impala安装,它是1.2.4。当我的集群中有任务节点时,它们出现在Impalad管理应用程序的“已知后端”列表中。但是,在“查询”页面的“查询位置”下,它只显示群集中核心节点的主机名,而不显示任务节点。这表明查询只在核心节点上运行。也许是因为HDFS只在核心节点上?

任何人都可以证实这一点?如果是这样,是否有办法让它使用它们?

干杯 汤姆

回答

0

帕拉将仅运行在核心节点(数据节点),为每个帕拉进程读取/直接写入本地存储HDFS的查询。这是Impala提高性能的方法之一。

相关问题