2015-09-05 53 views
-6

我正在学习hadoop。我正在尝试使用cloudera。但是当我输入jps时,它没有显示任何正在运行的进程。 我需要启动hadoop吗? 它不是自动启动hadoop吗? 如果我们需要开始如何做到这一点?如何在cloudera中启动hadoop?

还有一件事,hadoop和bigdata有什么区别?

回答

0

Hadoop可以被定义为由Apache Software Foundation编辑的工具的技术堆栈。有时它代表Apache的全局解决方案:HDFS,MapReduce,Mahout,Hive,HBase,Zookeeper,Storm,Spark,Flume,Sqoop,Yarn,Solr等等。我想有一个真正的定义(参见hadoop.apache.org),但是当人们谈论hadoop时,他们通常意味着“基于apache tecnologies的Bigdata解决方案”。某些编辑添加商业支持和/或汇总其他组件(HortonWorks,Cloudera,Stratio,...)。

要启动您进入Hadoop,您可以使用Cloudera虚拟机或hortonworks沙箱。在hortonworks网站上发布了许多有趣的教程,以了解Hadoop的工作原理。有趣的是在Cloudera环境中复制Hortonworks教程,以了解hadoop内核的内容,并了解Cloudera Manager提供的管理集群的功能。

JPS命令在你的nivel中不是很重要。当您了解什么是hadoop时,您会发现如何使用它,更重要的是,什么是大数据。