2012-02-01 94 views
5

我是Hadoop的新手。我一直在阅读HDFS,主要是关于“一次写作,随时阅读”。我有一个用例,我可能需要修改HDFS中存储的文件。我一直在研究是否有任何方法来做到这一点。更新hadoop HDFS文件

我的问题是可以将HDFS文件加载到HBase中,进行修改并将其保存回HDFS中,并删除原始文件。如果可行,请让我。

回答

4

如果您需要更新文件中的值,您可以更好地使用HBase。您仍然可以通过TableInputFormat和TableOutputFormat在MR作业中使用HBase表。如果你想附加数据,你可以使用任何支持hdfs append的hadoop版本,例如0.20.205.0。

+0

谢谢Steve。我可以使用hbase做randow写入hdfs文件还是仅附加? – 2012-02-01 23:28:04

+0

您可以随意修改hbase中的记录。 – 2012-02-02 00:30:46

+0

Steve我已经构建了一个能够在HDFS文件上的Hbase表。 当我试图用简单的'Put'命令更新Hbase记录im无法看到HDFS中的更改?它不应该自动更新? – Ragav 2014-02-20 22:30:46