2016-07-25 99 views
0

我试图在AWS上使用R来连接运行Cloudera hadoop的集群。遵循这里提到的步骤 - http://blog.cloudera.com/blog/2013/12/how-to-do-statistical-analysis-with-impala-and-r/Cloudera RImpala连接不起作用

到目前为止,我可以启动jdbc驱动程序,但无法连接到impala。

enter image description here

从一些调查中,我可以看到impala守护进程正在所有工作节点中运行。端口配置是这样的。

enter image description here

而且,我登录到工作节点之一,并检查被监听的端口。我可以看到端口21050听,这是,

enter image description here

在这里,在rimpala连接,我使用的工作节点的公共IP。仍然无法连接到。我可以使用公共IP和端口25000来查看impala web UI,但无法连接到侦听jdbc请求的此端口。任何人都可以帮助我吗?

回答

0

如果有人正在寻求帮助,这里是我从Cloudera支持获得的答案。

“的问题是不与黑斑羚或Cloudera的发行,问题 与司机正在使用的‘Rimpala’。RImapla使用HIVE JDBC 驱动程序。如果你在 https://github.com/Mu-Sigma/RImpala/blob/master/java/src/main/java/com/musigma/ird/bigdata/RImpala.java 查看源代码您将看到用作驱动器的呼叫是 “org.apache.hive.jdbc.HiveDriver”。因此理想情况下,RImpala软件包是 已过时,并且未更新才能正常工作。“