【发布时间】:2019-02-09 15:46:40
【问题描述】:
我的问题很简单,但是通过阅读文档我无法找到明确的答案。
我有 Spark2 在 CDH 5.10 集群上运行。 还有 Hive 和 Metastore。
我在我的 Spark 程序中创建一个会话,如下所示:
SparkSession spark = SparkSession.builder().appName("MyApp").enableHiveSupport().getOrCreate()
假设我有以下 HiveQL 查询:
spark.sql("SELECT someColumn FROM someTable")
我想知道是否:
- 在后台,此查询被转换为 Hive MapReduce 原语,或
- 对 HiveQL 的支持仅在语法级别,Spark SQL 将在后台使用。
我正在做一些性能评估,不知道是否应该声明使用spark.sql([hiveQL query]) 执行的查询的时间性能参考 Spark 或 Hive。
【问题讨论】:
标签: apache-spark hive apache-spark-sql hiveql