2010-09-19 69 views
0
  1. 我有一些Lucene的经验,我想了解数据是如何实际存储在Hadoop框架的从服务器中的?Hadoop Data Persistance使用哪种格式?

  2. 我们是否在Slave服务器中创建了一组索引来描述我们存储的文档?它在现实中如何运作?

回答

0

数据被拆分成特定大小的块,然后复制到群集中的其他节点以获得可靠性。这个过程由一个单一的“名称节点”来处理,它跟踪哪些数据块已经到达哪里。

的Hadoop提供了一个虚拟文件系统,类似于Unix的,您可以查询使用各种Hadoop filesystem tools(LS,GET,PUT等)

This link应该给你一个全面的概述。

+0

该链接有点过时。您应该前往http://hadoop.apache.org/hdfs/docs/current/hdfs_design.html获取当前版本的HDFS设计文档。 – 2010-10-15 10:19:57

+0

看起来这个链接也死了。试试这个([HTML](http://hadoop.apache.org/docs/r0.18.0/hdfs_design.html)| [PDF](http://hadoop.apache.org/docs/r0.18.0/hdfs_design。 PDF)) – kelloti 2013-02-15 20:31:24