2017-04-27 787 views
1

我对这个配置单元存储数据的位置有点困惑。Hive数据存储在哪里?

它将数据存储在HDFS中还是存储在RDBMS中? Hive Meta商店是否使用RDBMS来存储配置单元表元数据?

在此先感谢!

回答

0

Hive数据存储在Hadoop支持的文件系统之一:S3或HDFS。

Hive元数据存储在像MySQL这样的RDBMS中。

Hive表数据在S3或HDFS中的位置可以为托管表和HDFS指定。

托管表和外部表之间的差异是DROP TABLE语句将删除表并删除托管表的表数据。对于外部表DROP TABLE将只删除表,数据将保持不变,并可用于创建其他表。

请看这里:https://cwiki.apache.org/confluence/display/Hive/LanguageManual+DDL#LanguageManualDDL-CreateTableCreate/Drop/TruncateTable

0

这是您的问题的答案。但我会建议您阅读蜂巢图书或apache蜂巢网站以获得更好的理解。

它将数据存储在HDFS中还是存储在RDBMS中? - HIVE数据始终存储在HDFS中。对于托管表,数据默认存储在配置单元仓库中,这是HDFS中的一个目录。对于HIVE外部表用户可以指定HDFS中任何位置的位置。

Hive Meta商店是否使用RDBMS来存储配置单元表元数据? - 是HIVE使用RDBMS来存储元数据。