2017-06-01 393 views
0

我试图将表从配置单元导出到oracle数据库。sqoop java.lang.RuntimeException:无法解析输入数据

蜂房中的表格我尝试从

CREATE TABLE `db.to_oracle`(
    `ctn` string, 
    `platform_code` string, 
    `sum` double, 
    `days_ctn` int, 
    `mtr_comments` string, 
    `imsi` string, 
    `ban` int, 
    `price_plan` string, 
    `market_code` string, 
    `currency` string, 
    `balance` string, 
    `time_key` date) 
ROW FORMAT SERDE 
    'org.apache.hadoop.hive.serde2.lazy.LazySimpleSerDe' 
STORED AS INPUTFORMAT 
    'org.apache.hadoop.mapred.TextInputFormat' 
OUTPUTFORMAT 
    'org.apache.hadoop.hive.ql.io.HiveIgnoreKeyTextOutputFormat' 

我sqoop声明

sqoop export \ 
-D mapreduce.job.queuename=adhoc \ 
-D oracle.jdbc.mapDateToTimestamp=false \ 
--connect jdbc:oracle:thin:secret \ 
--password pas \ 
--username user\ 
--export-dir /apps/hive/warehouse/db.db/to_oracle/ \ 
--input-fields-terminated-by '\t' \ 
--input-lines-terminated-by '\n' \ 
--table database.oracle_table 

我得到这个错误导出

java.lang.RuntimeException: Can't parse input data: '9696278394S10.01dolg_neaktivnost#20170513_3#1#12.0525099318958479562895398812VSE1NIKORUR-9992017-05-13' 

看来sqoop无法识别的分隔符或者其他的东西。为什么是这样,我如何纠正它?

+0

db.to_oracle表中的字段分隔符是什么? - 通过'#'或'\ t'终止输入字段? –

+0

@dev它是'\ t'。我通过重新创建表并指定'ROW FORMAT DELIMITED FIELDS TERMINATED BY';''并使用';'作为分隔符来解决它。 – Evgenii

回答

0

问题是分隔符,因为你没有指定在蜂巢表中的分隔符,默认配置单元分隔符是:

FIELDS TERMINATED BY TERMINATED BY“\ 002 '\ 001'

藏品\ 003 '

LINES TERMINATED BY '\ n'

更改定界符无论是在'结尾BY

MAP KEYS'配置单元表创建或在您的sqoop作业中解决问题。