2013-03-24 53 views
0

我想写的是很容易被人从SQL背景的人使用的包装。我还没有开始这项工作,我想知道我应该采取什么方法。包装在蜂巢QL/UDF的/帕拉查询

这里的问题陈述 - 如果有人有很多写在他们的RDBMS数据的本地SQL,他们需要切换到Hadoop的,然后有很多的问题。 Hive已经消除了在hdfs中构建表的一个主要问题。现在到了查询的一部分 - 这一点,我们有不同的框架,但没有本身完整的 - 就像一个可能是缓慢的和其他可能缺乏的功能。例如,Impala有Hive QL,但最终用户没有ONE框架。 我打算做这样的事情 - select(逗号分隔的字符串名称,tableName).where(filter-expression)...

有点像Linq hdfs和它下面会找出什么是最好的办法执行select(蜂巢QL或黑斑羚),做一个where子句最好的办法,等

建议?想法?批判?

感谢

回答

1

为什么不使用ODBCJDBC驱动帕拉?这些驱动程序由第三方工具使用,如MicroStrategy或Tableau向Impala提交查询。