Hadoop Data Persistance使用哪种格式？

我有一些Lucene的经验，我想了解数据是如何实际存储在Hadoop框架的从服务器中的？Hadoop Data Persistance使用哪种格式？
我们是否在Slave服务器中创建了一组索引来描述我们存储的文档？它在现实中如何运作？

来源

2010-09-19 realnumber

数据被拆分成特定大小的块，然后复制到群集中的其他节点以获得可靠性。这个过程由一个单一的“名称节点”来处理，它跟踪哪些数据块已经到达哪里。

的Hadoop提供了一个虚拟文件系统，类似于Unix的，您可以查询使用各种Hadoop filesystem tools（LS，GET，PUT等）

This link应该给你一个全面的概述。

来源

2010-09-20 11:48:37

该链接有点过时。您应该前往http://hadoop.apache.org/hdfs/docs/current/hdfs_design.html获取当前版本的HDFS设计文档。 – 2010-10-15 10:19:57

看起来这个链接也死了。试试这个（[HTML]（http://hadoop.apache.org/docs/r0.18.0/hdfs_design.html）| [PDF]（http://hadoop.apache.org/docs/r0.18.0/hdfs_design。 PDF）） – kelloti 2013-02-15 20:31:24

Hadoop Data Persistance使用哪种格式？

回答

相关问题