2017-06-18 86 views
0

有没有办法将Sqoop连接到不同的Hadoop群集,以便可以创建多个Sqoop作业来将数据导出到多个hadoop群集?如何将Sqoop连接到多个hadoop群集

+0

我认为Sqoop2可以做到这一点,但Sqoop1与您的hdfs配置文件密切相关 –

+0

@ cricket_007您能指点我一些关于Sqoop2如何做的文档。 – Shengjie

+0

sqoop.apache.org提供您需要的所有信息 –

回答

1

将数据导出到多个Hadoop集群

如果数据进入Hadoop的,这是技术上的一个Sqoop进口

不清楚如何你现在从一台计算机管理不同的集群,但你会需要有可用于Sqoop读取的所有环境的conf文件夹

sqoop命令行程序是一个包装器,它运行Hadoop附带的脚本。如果您的计算机上存在多个Hadoop安装,则可以通过设置$HADOOP_HOME环境变量来选择Hadoop安装。

例如:

$ HADOOP_HOME=/path/to/some/hadoop sqoop import --arguments... 

或:

$ export HADOOP_HOME=/some/path/to/hadoop 
    $ sqoop import --arguments... 

如果$HADOOP_HOME没有设置,Sqoop将使用默认安装位置Cloudera的分销Hadoop的,/usr/lib/hadoop
主动Hadoop配置从$HADOOP_HOME/conf/加载,除非$HADOOP_CONF_DIR环境变量设置

https://sqoop.apache.org/docs/1.4.6/SqoopUserGuide.html#_controlling_the_hadoop_installation

根据设置如何你的Hadoop,Hortonworks只有Sqoop 1,而Cloudera的(也许MAPR)有Sqoop2,这些指令可能不同,因为Sqoop2架构不同。