蜂巢火花子进程连接回

之前退出我有一个问题，蜂巢上的火花，当我蜂巢控制台上运行一样蜂巢火花子进程连接回

select * from table_name

简单的查询每一件事情的效果很好，但是当我执行

select count(*) from table_name

Query ID = ab_20160515134700_795fc14c-e89b-4172-bcc6-0cfcffadcd88 
Total jobs = 1 
Launching Job 1 out of 1 
In order to change the average load for a reducer (in bytes): 
    set hive.exec.reducers.bytes.per.reducer=<number> 
In order to limit the maximum number of reducers: 
    set hive.exec.reducers.max=<number> 
In order to set a constant number of reducers: 
    set mapreduce.job.reduces=<number> 
Starting Spark Job = d5e1856e-de67-4e2d-a914-ca1aae324b7f 
Status: SENT 
Failed to execute spark task, with exception 'java.lang.IllegalStateException(RPC channel is closed.)' 
FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.spark.SparkTask

012：

查询与下列错误终止个

版本：

hadoop-2.7.2 
apache-hive-2.0.0 
spark-1.6.0-bin-hadoop2 
scala: 2.11.8

我已设置： spark.master在蜂房的site.xml 现在我得到：java.util.concurrent.ExecutionException：了java.lang.RuntimeException：取消客户的8ffe7ea3 -aaf4-456c-ae18-23c572a766c5' 。错误：子进程在连接回到io.netty.util.concurrent.AbstractFuture.get（AbstractFuture.java:37）〜[netty-all-4.0.23.Final.jar：4.0.23.Final]之前退出。 apache.hive.spark.client.SparkClientImpl。（SparkClientImpl.java:101）[hive-exec-2.0.0.jar：2.0.0] at org.apache.hive.spark.client.SparkClientFactory.createClient（SparkClientFactory.java ：80）[hive-exec-2.0.0.jar：2.0.0] at org.apache.hadoop.hive.ql.exec.spark.RemoteHiveSparkClient.createRemoteClient（RemoteHiveSparkClient.java:98）[hive-exec-2.0。 org.apache.hadoop.hive.ql.exec.spark.RemoteHiveSparkClient。（RemoteHiveSparkClient.java:94）[hive-exec-2.0.0.jar：2.0.0]。在org.apache.hadoop.hive.ql.exec上的apache.hadoop.hive.ql.exec.spark.HiveSparkClientFactory.createHiveSparkClient（HiveSparkClientFactory.java:63）[hive-exec-2.0.0.jar：2.0.0]。 spark.session.SparkSessionImpl.open（SparkSessionImpl.java:55）[hive-exec-2.0.0.jar：2.0.0] at org.apache.hadoop.hive.ql.exec.spark.session.SparkSessionManagerImpl.getSessio n（SparkSessionManagerImpl.java:114）[hive-exec-2.0.0.jar：2.0.0] at org.apache.hadoop.hive.ql.exec.spark.SparkUtilities.getSparkSession（SparkUtilities.java:131）[hive -exec-2.0.0.jar：2.0.0] at org.apache.hadoop.hive.ql.exec.spark.SparkTask.execute（SparkTask.java:106）[hive-exec-2.0.0.jar：2.0 .0]在org.apache.hadoop.hive的org.apache.hadoop.hive.ql.exec.Task.executeTask（Task.java:158）[hive-exec-2.0.0.jar：2.0.0]。 ql.exec.TaskRunner.runSequential（TaskRunner.java:101）[hive-exec-2.0.0.jar：2.0.0] at org.apache.hadoop.hive.ql.Driver.launchTask（Driver.java:1840） [hive-exec-2.0.0.jar：2.0.0] at org.apache.hadoop.hive.ql.Driver.execute（Driver.java:1584）[hive-exec-2.0.0.jar：2.0.0 ]在org.apache.hadoop.hive.ql.Driver的org.apache.hadoop.hive.ql.Driver.runInternal（Driver.java:1361）[hive-exec-2.0.0.jar：2.0.0]。运行（Driver.java:1184）[hive-exec-2.0.0.jar：2.0.0] at org.apache.hadoop.hive.ql.Driver.run（Driver.java:1172）[hive-exec-2.0 .0.jar：2.0.0]在org.apache.hadoop.hive.cli.CliDriver.processLocalCmd （CliDriver.java:233）[hive-cli-2.0.0.jar：2.0.0] at org.apache.hadoop.hive.cli.CliDriver.processCmd（CliDriver.java:184）[hive-cli-2.0。 0.jar：2.0.0]在org.apache.hadoop.cli.CliDriver.processLine（CliDriver.java:400）[hive-cli-2.0.0.jar：2.0.0] at org.apache.hadoop .hive.cli.CliDriver.executeDriver（CliDriver.java:778）[hive-cli-2.0.0.jar：2.0.0] at org.apache.hadoop.hive.cli.CliDriver.run（CliDriver.java:717 ）[hive-cli-2.0.0.jar：2.0.0] at org.apache.hadoop.hive.cli.CliDriver.main（CliDriver.java:645）[hive-cli-2.0.0.jar：2.0。 0] at sun.reflect.NativeMethodAccessorImpl.invoke0（Native Method）〜[？：1.8.0_77] at sun.reflect.NativeMethodAccessorImpl.invoke（NativeMethodAccessorImpl.java:62）〜[？：1.8.0_77] at sun.reflect。在org.apache.hadoop的java.lang.reflect.Method.invoke（Method.java:498）〜[？：1.8.0_77]处DelegatingMethodAccessorImpl.invoke（DelegatingMethodAccessorImpl.java:43）〜[？：1.8.0_77]。 org.apache.hadoop.util.RunJa上的util.RunJar.run（RunJar.java:221）[spark-assembly-1.6.0-hadoop2.6.0.jar：1.6.0] r.main（RunJar.java:136）[spark-assembly-1.6.0-hadoop2.6.0.jar：1.6.0]引起：java.lang.RuntimeException：取消客户端'8ffe7ea3-aaf4-456c-ae18-23c572a766c5 ”。错误：在org处连接到org.apache.hive.spark.client.rpc.RpcServer.cancelClient（RpcServer.java:180）〜[hive-exec-2.0.0.jar：2.0.0]之前退出子进程。 apache.hive.spark.client.SparkClientImpl $ 3.run（SparkClientImpl.java:450）〜[hive-exec-2.0.0.jar：2.0.0] at java.lang。Thread.run（Thread.java:745）〜[：？1.8.0_77] 16/05/16十八时00分33秒[驱动]：WARN client.SparkClientImpl：儿童过程退出，代码1

我已经构建了Spark 1.6.1和配置单元2.0.0，所以错误已更改为：

Exception in thread "main" java.lang.NoClassDefFoundError: scala/collection/Iterable 
    at org.apache.hadoop.hive.ql.parse.spark.GenSparkProcContext.<init>(GenSparkProcContext.java:163) 
    at org.apache.hadoop.hive.ql.parse.spark.SparkCompiler.generateTaskTree(SparkCompiler.java:195) 
    at org.apache.hadoop.hive.ql.parse.TaskCompiler.compile(TaskCompiler.java:258) 
    at org.apache.hadoop.hive.ql.parse.SemanticAnalyzer.analyzeInternal(SemanticAnalyzer.java:10861) 
    at org.apache.hadoop.hive.ql.parse.CalcitePlanner.analyzeInternal(CalcitePlanner.java:239) 
    at org.apache.hadoop.hive.ql.parse.BaseSemanticAnalyzer.analyze(BaseSemanticAnalyzer.java:250) 
    at org.apache.hadoop.hive.ql.Driver.compile(Driver.java:437) 
    at org.apache.hadoop.hive.ql.Driver.compile(Driver.java:329) 
    at org.apache.hadoop.hive.ql.Driver.compileInternal(Driver.java:1158) 
    at org.apache.hadoop.hive.ql.Driver.runInternal(Driver.java:1253) 
    at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1084) 
    at org.apache.hadoop.hive.ql.Driver.run(Driver.java:1072) 
    at org.apache.hadoop.hive.cli.CliDriver.processLocalCmd(CliDriver.java:232) 
    at org.apache.hadoop.hive.cli.CliDriver.processCmd(CliDriver.java:183) 
    at org.apache.hadoop.hive.cli.CliDriver.processLine(CliDriver.java:399) 
    at org.apache.hadoop.hive.cli.CliDriver.executeDriver(CliDriver.java:776) 
    at org.apache.hadoop.hive.cli.CliDriver.run(CliDriver.java:714) 
    at org.apache.hadoop.hive.cli.CliDriver.main(CliDriver.java:641) 
    at sun.reflect.NativeMethodAccessorImpl.invoke0(Native Method) 
    at sun.reflect.NativeMethodAccessorImpl.invoke(NativeMethodAccessorImpl.java:62) 
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43) 
    at java.lang.reflect.Method.invoke(Method.java:498) 
    at org.apache.hadoop.util.RunJar.run(RunJar.java:221) 
    at org.apache.hadoop.util.RunJar.main(RunJar.java:136) 
Caused by: java.lang.ClassNotFoundException: scala.collection.Iterable 
    at java.net.URLClassLoader.findClass(URLClassLoader.java:381) 
    at java.lang.ClassLoader.loadClass(ClassLoader.java:424) 
    at sun.misc.Launcher$AppClassLoader.loadClass(Launcher.java:331) 
    at java.lang.ClassLoader.loadClass(ClassLoader.java:357)

来源

2016-05-15 Ali Basiri

你能粘贴完整的堆栈跟踪吗？ –

这意味着你的jar文件不一致，即没有用相同的代码编译。请通过链接类似的问题在这里讨论https://issues.apache.org/jira/browse/HIVE-9970 –

我在Hive 2.0.0和Spark 1.6.1中遇到了同样的问题。如前所述，已在issues.apache.org/jira/browse/HIVE-9970处讨论过。

具有表示，对于蜂巢：

下载蜂巢源包
设置正确的Hadoop /星火/ TEZ版本在的pom.xml
展开Maven的内存限制。我使用export MAVEN_OPTS="-Xmx2g -XX:MaxPermSize=512M -XX:ReservedCodeCacheSize=512m"
构建配置单元使用Maven：mvn clean package -Pdist -DskipTests
结果在：packaging/target/apache-hive-2.x.y-bin。配置hive-site.xml。

火花：

下载星火源包
设置正确的Hadoop版本在的pom.xml
构建星火不蜂巢使用./make-distribution.sh --name "hadoop2-without-hive" --tgz "-Pyarn,hadoop-provided,hadoop-2.6,parquet-provided"
结果在dist/ 。配置spark-defaults.conf。

由于您已经构建了没有Hadoop的Spark，因此您需要将Hadoop包jars路径包含到$ SPARK_DIST_CLASSPATH中。见this documentation page。此外，您可以阅读Hive on Spark guide作为参考。

来源

2016-05-21 23:10:22

谢谢你的帮助。我已经完成了你的建议，现在当我执行从table_name中选择count（*）时，错误已经更改为：线程“main”中的异常java.lang.NoClassDefFoundError：scala/collection/Iterable –

我正面临着这个问题太。你有没有设法解决这个问题？ –

蜂巢火花子进程连接回

回答

相关问题