【发布时间】:2022-03-01 15:54:25
【问题描述】:
我对蜂巢将数据存储在哪里有点困惑。
它是将数据存储在 HDFS 还是 RDBMS 中? Hive Meta 存储是否使用 RDBMS 来存储 hive 表元数据??
提前致谢!!
【问题讨论】:
标签: hadoop hive hdfs hive-metastore
我对蜂巢将数据存储在哪里有点困惑。
它是将数据存储在 HDFS 还是 RDBMS 中? Hive Meta 存储是否使用 RDBMS 来存储 hive 表元数据??
提前致谢!!
【问题讨论】:
标签: hadoop hive hdfs hive-metastore
Hive 数据存储在Hadoop compatible filesystem 之一中:S3、HDFS 或其他兼容的文件系统。
Hive 元数据像 MySQL 一样存储在 RDBMS 中,请参阅 supported RDBMS。
可以为托管表和外部表指定 Hive 表数据在 S3 或 HDFS 中的位置。
托管表和外部表的区别在于DROP TABLE 语句,在托管表中,将删除表并删除表的数据。而对于外部表 DROP TABLE 将只删除该表,数据将保持原样并可用于在其上创建其他表。
在此处查看详细信息:Create/Drop/Truncate Table
【讨论】:
这是您问题的答案。但我会建议你阅读 hive 书籍或 apache hive 网站以更好地理解。
它是将数据存储在 HDFS 还是 RDBMS 中? - HIVE 的数据始终存储在 HDFS 中。对于托管表,数据默认存储在 hive 仓库中,即 HDFS 中的目录。对于 HIVE 外部表,用户可以在 HDFS 中的任何位置指定位置。
Hive Meta 存储是否使用 RDBMS 来存储 hive 表元数据? - 是的,HIVE 使用 RDBMS 来存储元数据。
【讨论】: