2014-01-21 49 views
0

我希望每周都会将数据文件转换为AVRO,数据文件格式为XML,Excels,分隔格式。您是否建议在HDFS下以原始格式备份源文件,或在本地文件系统(不是HDFS)下面的文件夹中备份文件。在hadoop中备份源数据文件

这些文件来自FTP。

回答

0

转换过程成功后,由于HDFS托管AVRO文件,因此假设您根据需要设置复制因子,它将负责备份。此时,将源文件保存在HDFS中是不必要的。可能是磁带备份在这一点上是最佳的。

+0

在HDFS中存储备份有哪些可能的挑战?存储成本便宜且易于访问...也许将文件压缩并存储在HDFS中的某个位置 – raunakjhawar

+0

一些公司拥有大量数据流入,并且应该有一个备份,直到x年。即使内存很便宜,我也不认为使用HDFS作为备份存储机制是个好主意。 –

+0

但是可以依赖本地文件系统来存储数据备份吗? HDFS更可靠 – raunakjhawar