2016-11-25 52 views
0

嗨,我在我的配置单元表中有一个支持HBase的200 GB数据。 我必须从当前仅用于3个文件的表中创建142个不同的文件。从Hive表中插入多个文件不起作用?

我想运行所有查询以同时运行并行。 我想从多个文件插入蜂巢表,但得到解析异常。

这是我试过的查询。

FROM hbase_table_FinancialLineItem 

INSERT OVERWRITE LOCAL DIRECTORY '/hadoop/user/m6034690/FSDI/FinancialLineItem/Japan.txt' 
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY '\t' 
STORED AS TEXTFILE 
select * from hbase_table_FinancialLineItem WHERE FilePartition='Japan' 

INSERT OVERWRITE LOCAL DIRECTORY '/hadoop/user/m6034690/FSDI/FinancialLineItem/SelfSourcedPrivate.txt' 
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY '\t' 
STORED AS TEXTFILE 
select * from hbase_table_FinancialLineItem WHERE FilePartition='SelfSourcedPrivate' 


INSERT OVERWRITE LOCAL DIRECTORY '/hadoop/user/m6034690/FSDI/FinancialLineItem/ThirdPartyPrivate.txt' 
ROW FORMAT DELIMITED 
FIELDS TERMINATED BY '\t' 
STORED AS TEXTFILE 
select * from hbase_table_FinancialLineItem WHERE FilePartition='ThirdPartyPrivate'; 

而且运行后,我得到了以下错误。

FAILED: ParseException line 7:9 missing EOF at 'from' near '*' 
+0

ParseException是因为你在每个INSERT结尾缺少分号 –

+0

我想导入本地目录。如果我提供了半列,那么每个查询将独立运行,不像多表插入。 – SUDARSHAN

+0

我不认为它会这样工作。如果你想并行运行所有的蜂巢插入,尝试运行它作为oozie蜂巢行动的工作 –

回答

0

我认为在每次插入覆盖的末尾添加这个FROM hbase_table_FinancialLineItem;可以解决这个问题。