【发布时间】:2019-07-31 11:39:02
【问题描述】:
您好,我想了解 SparkSQL 将表元数据存储在 Spark 中的什么位置?如果默认不在 Hive 元存储中,那么它存储在哪里?
【问题讨论】:
标签: apache-spark apache-spark-sql apache-spark-2.0
您好,我想了解 SparkSQL 将表元数据存储在 Spark 中的什么位置?如果默认不在 Hive 元存储中,那么它存储在哪里?
【问题讨论】:
标签: apache-spark apache-spark-sql apache-spark-2.0
这里是 spark-2.2.0 文档的解释
hive-site.xml未配置时,上下文自动在当前目录创建metastore_db,并创建spark.sql.warehouse.dir配置的目录,默认为当前目录下的spark-warehouse目录Spark 应用程序已启动。请注意,自 Spark 2.0.0 以来,hive-site.xml 中的 hive.metastore.warehouse.dir 属性已被弃用。而是使用spark.sql.warehouse.dir 指定仓库中数据库的默认位置。
这里是链接: https://spark.apache.org/docs/latest/sql-data-sources-hive-tables.html
【讨论】: