2013-04-30 55 views
0

最近,我工作的公司将其部分长期存储迁移到了Hadoop和Hive。Hadoop Hive IN文件中的声明

我有一个任务,我需要查询table_a的信息,其中table_b.unique是一个文本文件。该文本文件将在查询开始之前通过脚本上传。

从我的搜索,似乎唯一的方法是将文本文件中的数据加载到表中,然后执行查询;但是我无法访问CREATE表。

有什么办法把这个蜂巢查询,并将其从table_B.unique改变=“ABCD1234”到使用IN语句的文本文件,而无需将文件加载到表第一?

SELECT * FROM table_A 
JOIN table_B 
ON (table_A.instancename = table_B.id AND table_B.unique = 'abcd1234'); 

回答

0

如果您不能创建任何表(甚至没有外部表?),那么我不相信你可以使用HQL。

您可以使用拉丁语Pig来达到此目的。