2015-10-18 81 views
1

我正在做一些关于Hadoop快照的研究;创建,删除,等我有一些疑问:Hadoop快照查询 - 删除和元数据信息

  1. 当我做磁盘上的数据的快照,只是创建特定的文件/目录的快照或所有存在的副本(假设复制因素是3)?
  2. 快照记录它执行的文件/目录的块大小和文件位置。除了.snapshot目录之外,我无法在计算机上找到或查找元数据信息。任何人都有任何信息如何查看这些元数据信息?
  3. 此外,用于HDFS快照的Apache维基提到无法删除快照目录。但是,我能够删除创建的.snapshot目录。它没有任何父代或后代快照目录/文件。

任何人都有这方面的见解?

+0

它看起来像三个单独的问题,所有三个都缺少重现步骤,重新使用,哪个操作系统,哪个Java供应商和版本等。 –

+0

尽管我确实收到了您的评论,但我不知道hadoop快照取决于操作系统和Java供应商。如果是您指的Hadoop框架,那么我将使用HDP 1.6和Oracle Java 7.底层操作系统是Centos 6.5 – knowone

+0

前两个问题仍然完好无损,尚无解决方案。我正在研究第三个,遇到了令人震惊的事情。 a)如果我们删除了一个文件,它的快照已经创建好了,我们也从.Trash中删除它。这种删除实际上表明该文件被删除。我还比较了该文件夹的磁盘使用情况,并确认该大小已减少了已删除文件的大小。 b)但是,当我看到.snapshot目录中的文件时,我将所有的文件(甚至是已删除的文件)都记录下来。并且添加快照的单个文件大小可获得总大小b4删除。 – knowone

回答

0

1.当我在磁盘上进行数据快照时,是否仅为该特定文件/目录或存在的所有副本(假设复制因子为3)创建快照? - 根据我的信息,它仍然是相同的,如果HDFS RF是3 - 相同的快照保留以及

2.快照记录它执行的文件/目录的块大小和文件位置。除了.snapshot目录之外,我无法在计算机上找到或查找元数据信息。任何人都有任何信息如何查看这些元数据信息? - 目前不确定

3.此外,Apache维基HDFS快照提到无法删除快照目录。但是,我能够删除创建的.snapshot目录。它没有任何父代或后代快照目录/文件。 - 这并不意味着你必须删除快照。通过这个语句,这意味着你不能删除创建快照的HDFS目录(快照可以随时删除/删除)