我最近遇到了Apache Kylin,并且很好奇它的用例是什么。据我所知,这似乎是一个工具,旨在解决与超过10亿行相关的非常具体的问题,汇总,缓存和查询来自其他来源(HBase,Hadoop,Hive)的数据。我在这个假设中纠正了吗?什么是Apache Kylin用例?
回答
Apache Kylin的用例是Hadoop上的交互式大数据分析。它允许您通过3个简单步骤以亚秒级的时间间隔查询大型Hive表。
- 在星型模式中标识一组Hive表。
- 在离线批处理过程中从Hive表中构建一个多维数据集。
- 使用SQL查询Hive表,并通过Rest API,ODBC或JDBC在秒内获得结果。
用例相当一般,它可以快速查询任何Hive表,只要您可以从表中定义星型模式和模型立方体即可。如果您不确定什么是星型模式和什么是多维数据集,请检查Kylin terminologies。
Kylin提供了ANSI SQL接口,因此您可以像过去一样查询Hive表。然而,一个限制是麒麟只提供汇总结果,换句话说,SQL应该包含一个“group by”子句以产生正确的结果。这通常很好,因为大数据分析更注重汇总结果而不是单个记录。
以下用例是否有效? a)使用蜂房连接器 c)中麒麟将处理映射配置单元架构于立方体模式和执行所述地图的使用HiveQL b)中加载数据设计一个星型架构成的Hadoop通过HiveQL d)输出的结果/缩小查询HBase e)使用Kylin通过Calcite to HBase执行SQL语句并将结果作为JSON返回。 –
非常接近!只需要注意步骤c)是手动的,Hive模式到多维数据集模式的映射是手动的,Kylin为您提供了一个GUI。此外,步骤d)输出不是特定于任何查询的,而是Hive数据的一般索引,我们称之为索引“cube”。 –
- 1. Apache Kylin - 空值测量变为零?
- 2. Kylin的SQLRequest中'acceptPartial'和'backdoorToggles'的含义是什么?
- 3. 什么是apache zeppelin?
- 4. 什么是zeromq用例?
- 5. ContextCompat.checkSelfPermission的用例是什么?
- 6. 什么是Apache contrib模块?
- 7. 例外 - 什么是“例外”?
- 8. Apache kylin魔方失败“没有任务计数器”
- 9. Apache Kylin - 创建立方体时没有平均尺寸
- 10. 从蜂巢获取增量数据到apache kylin的方法?
- 11. 什么是Apache Thrift中的“注释”,它用于什么?
- 12. 什么是Apache的常见配置
- 13. 什么是Apache Helix中的“分区”
- 14. 什么是Google AppEngine实例?
- 15. 这是什么例外?
- 16. 什么是存根例程?
- 17. JavaScript - 什么是单例类?
- 18. 什么是实例变量?
- 19. 什么是apache的最大url长度?
- 20. 什么是Apache Commons Pool close()行为
- 21. 什么是用例在春季安全
- 22. 什么是tr1 :: result_of的好用例?
- 23. Git SOFT重置的用例是什么?
- 24. 什么是.NET DataTable最佳用例?
- 25. HANDLER OPEN/READ/CLOSE的用例是什么?
- 26. 什么是用例匿名联合型
- 27. Bash变量$ _的用例是什么?
- 28. ASP.NET MVC - 什么是Url.Content()的用例?
- 29. 什么是SharePoint的“酷”用例?
- 30. Python classmethod的用例是什么?
看看:http://www.ebaytechblog.com/2014/10/20/announcing-kylin-extreme-olap-engine-for-big-data/ –
这并不真正给出通用的用例,而是解释Ebay如何使用它(如ebay首先开发的工具)和产品架构。 –