0
嗨,我在我的配置单元表中有一个支持HBase的200 GB数据。 我必须从当前仅用于3个文件的表中创建142个不同的文件。从Hive表中插入多个文件不起作用?
我想运行所有查询以同时运行并行。 我想从多个文件插入蜂巢表,但得到解析异常。
这是我试过的查询。
FROM hbase_table_FinancialLineItem
INSERT OVERWRITE LOCAL DIRECTORY '/hadoop/user/m6034690/FSDI/FinancialLineItem/Japan.txt'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
STORED AS TEXTFILE
select * from hbase_table_FinancialLineItem WHERE FilePartition='Japan'
INSERT OVERWRITE LOCAL DIRECTORY '/hadoop/user/m6034690/FSDI/FinancialLineItem/SelfSourcedPrivate.txt'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
STORED AS TEXTFILE
select * from hbase_table_FinancialLineItem WHERE FilePartition='SelfSourcedPrivate'
INSERT OVERWRITE LOCAL DIRECTORY '/hadoop/user/m6034690/FSDI/FinancialLineItem/ThirdPartyPrivate.txt'
ROW FORMAT DELIMITED
FIELDS TERMINATED BY '\t'
STORED AS TEXTFILE
select * from hbase_table_FinancialLineItem WHERE FilePartition='ThirdPartyPrivate';
而且运行后,我得到了以下错误。
FAILED: ParseException line 7:9 missing EOF at 'from' near '*'
ParseException是因为你在每个INSERT结尾缺少分号 –
我想导入本地目录。如果我提供了半列,那么每个查询将独立运行,不像多表插入。 – SUDARSHAN
我不认为它会这样工作。如果你想并行运行所有的蜂巢插入,尝试运行它作为oozie蜂巢行动的工作 –