这是我们组中的一个普遍问题,我们的Hive查询经常会扩展,以占用我们CDH群集上大多数可用的YARN执行程序和内存。虽然底层问题出在我们表格的分区数量和连接的复杂性上,但我们不能自由地重建这些表格。我们可以通过配置spark.dynamicAllocation.maxExecutors和spark.executor.memory来控制Spark中的资源消耗。我们可以在Hue上使用类似的东西,这样Hue能够与群集上的其他作业“发挥出色”吗?是否有Hive on Hue(CDH 5.9.3)的配置设置限制可以使用的容器数量?
1
A
回答
0
色调是一个用户界面,无法控制Hive使用多少资源。这由YARN通过调度策略来控制。对于CDH群集,通常使用公平调度程序。
http://hadoop.apache.org/docs/stable/hadoop-yarn/hadoop-yarn-site/FairScheduler.html
你应该看看关于如何设置此的一些背景信息如下。
0
是的,你可以更好地管理的Hadoop集群的计算资源量从Hue
-launched Hive
查询使用。
为了做到这一点,您需要先配置YARN调度程序队列;对于Cloudera的CDH分布,这些被称为动态资源池
您可以了解更多有关此主题的CDH Documentation
一旦配置供您色相推出,半互动,蜂巢查询池内,可以通过为mapred.job.queue.name
密钥的值传递资源池名称来指示Hive通过此池访问单个查询。
假设我们的队列名称为interactive.hive_queue
。我们HiveQL查询语句之前,我们会在前面加上这个SET
声明:
SET mapred.job.queue.name=interactive.hive_queue;
您可能需要更新您的顺化配置hue.ini
,以允许通过您的色相的用户通过这个配置值
您还应该能够为Hue创建一个已保存的Hive配置,以便始终为您的Hue启动的Hive查询使用此YARN队列。
(假设您正在使用的MapReduce(MR2)执行引擎为您的蜂巢查询)
如果你想改变你所有的蜂巢查询的队列中,你可以做这通过更改Hive Server2配置hive-site.xml
。这种变化看起来像:
<property>
<name>mapreduce.job.queuename</name>
<value>interactive.hive_queue</value>
</property>
相关问题
- 1. 是否可以设置用户/组/表级Hive配置参数?
- 2. 您可以使用的.animate()的数量是否有限制
- 3. 是否有可能专门为变量设置内存限制?
- 4. 是否可以使用Nhibernate配置来设置NLS_SORT?
- 5. 对可以选择的复选框数量设置限制
- 6. Hue中的Hive变量
- 7. 是否有一个PHP配置设置可以防止在设置之前使用变量?
- 8. 是否可以有多个appveyor.yml配置?
- 9. 是否可以使用可变数量的URI参数配置JAX-RS方法?
- 10. 可以添加到DbCommand的参数数量是否有限制?
- 11. 是否可以使用swfObject设置cookie?
- 12. Oracle中可以加入的表的数量是否有限制?
- 13. 配置数量的FPGA限制?
- 14. 是否可以为用户设置数据库行级权限?
- 15. 限制配置节的数量
- 16. 是否可以为系统中的所有用户设置Git配置?
- 17. 是否可以限制编译器显示的错误数量?
- 18. 我们是否可以在HIVE中为BIGINT列设置空值
- 19. 是否可以有条件地require_once,设置全局变量或设置常量?
- 20. 是否有我可以设置动态限制或增加每页帖子数量的参数
- 21. HIVE创建表挂 - CDH 5.7
- 22. R snow可以创建的奴隶数量是否有限制?
- 23. kendo listview是否对可以显示的数据量有限制?
- 24. SpreadsheetGear WorkbookView中可以保存的数据量是否有限制?
- 25. 是否可以打开的窗口数量有限制?
- 26. WinDbg可以看到的模块数量是否有限制?
- 27. Freemarker可以呈现的数据量是否有限制?
- 28. 是否可以设置VoiceMailNumber?
- 29. 是否可以在控制器类中设置Pane的recoures?
- 30. 是否可以使用现有的邮件帐户设置?