0
我有一些Lucene的经验,我想了解数据是如何实际存储在Hadoop框架的从服务器中的?Hadoop Data Persistance使用哪种格式?
我们是否在Slave服务器中创建了一组索引来描述我们存储的文档?它在现实中如何运作?
我有一些Lucene的经验,我想了解数据是如何实际存储在Hadoop框架的从服务器中的?Hadoop Data Persistance使用哪种格式?
我们是否在Slave服务器中创建了一组索引来描述我们存储的文档?它在现实中如何运作?
数据被拆分成特定大小的块,然后复制到群集中的其他节点以获得可靠性。这个过程由一个单一的“名称节点”来处理,它跟踪哪些数据块已经到达哪里。
的Hadoop提供了一个虚拟文件系统,类似于Unix的,您可以查询使用各种Hadoop filesystem tools(LS,GET,PUT等)
This link应该给你一个全面的概述。
该链接有点过时。您应该前往http://hadoop.apache.org/hdfs/docs/current/hdfs_design.html获取当前版本的HDFS设计文档。 – 2010-10-15 10:19:57
看起来这个链接也死了。试试这个([HTML](http://hadoop.apache.org/docs/r0.18.0/hdfs_design.html)| [PDF](http://hadoop.apache.org/docs/r0.18.0/hdfs_design。 PDF)) – kelloti 2013-02-15 20:31:24