2015-12-02 40 views
0

目前我有2台机器它们中的一个的霍顿沙箱我已经配置它作为名称节点,并从它和其他机器退役数据节点我所制成,并使其作为数据节点和我有在它上面安装了hive服务器。 此外,并指定了它的奴隶角色,我用Ambari来完成它。 我的问题是它的我第一次使用Hadoop的我的计划是将数据从SQL数据库传输到Hadoop的那么这是否意味着我必须安装在数据节点的MySQL,而我将使用sqoop和其他的东西会出现什么名字节点怎么办?我该查询它,并把它传递查询到数据管理部我真的很迷茫,真的有巨大的压力,完成所以请原谅我,是新手的机器设备都默认我选择的DataNode的第一台机器和节点管理器对于第二个没有特殊配置的人来说,如果你有一个我能理解的简单例子, 非常感谢各位伙伴hadoop的架构查询示例

回答

0

Sqoop是一款专为在Hadoop和关系数据库服务器之间传输数据而设计的工具。它用于从关系数据库(如MySQL,Oracle)导入数据到Hadoop HDFS,并从Hadoop文件系统导出到关系数据库。

例如喜欢 - 你有一些数据在其他机器的MySQL,你必须将数据传输到您的Hadoop HDFS。在这种情况下sqoop将用于

的NameNode存储元数据(没有块的,在其上机架,其数据管理部存储的数据和其他细节)有关的数据被存储在的DataNodes而数据管理部存储的实际数据。

+0

这个劲歌,当您运行查询要查询的数据节点,这确实需要对数据管理部安装mysql,我应该从NameNode会得到什么样的信息,我会为了完成我的毕业来传输数据到数据管理部项目 –