2017-07-25 107 views
0

我试图用Importtsv加载csv文件到HBase的。加载csv文件到HBase的使用Importtsv

我已经上传了customers1.csv到HDFS,创建了一个名为T1一个HBase的表使用命令

hbase(main):001:0> create 't1','FirstName','LastName' 

,当我尝试通过运行命令加载CSV数据到HBase的表t1:

hbase(main):010:0> hbase org.apache.hadoop.hbase.mapreduce.ImportTsv-Dimporttsv.separator=',' -Dimporttsv.columns='HBASE_ROW_KEY,FirstName,LastName' t1 hdfs://my.cluster.com/user/maapr/test/customers1.csv 

我无法加载由于数据:

SyntaxError: (hbase):10: syntax error, unexpected tIDENTIFIER 

我跟着从水库的语法在线搜索,但我仍然有这个语法错误。任何想法是怎么回事?您的解决方案将非常感激。

而另一个愚蠢的问题。有没有其他办法从HDFS的数据加载到HBase的除了Importtsv?谢谢。

回答

0

正在运行从HBase的批量加载命令壳。走出HBase的外壳,并尝试..需要在这部分:)

空间:ImportTsv -Dimporttsv.separator =“”

hbase org.apache.hadoop.hbase.mapreduce.ImportTsv -Dimporttsv.separator=',' -Dimporttsv.columns='HBASE_ROW_KEY,FirstName,LastName' t1 hdfs://my.cluster.comser/maapr/test/customers1.csv 

对于批量加载,你也可以写一个定制MR工作。 我使用阿帕奇凤凰批量加载工具我的凤凰HBase的表。

+0

和我们需要什么样'-Dimporttsv.columns ='写的时候,我们不知道有至少150列? – Marine1