【发布时间】:2019-03-06 15:32:02
【问题描述】:
我有一个大约有 2500 列的 hive 表,当我像这样通过 spark sql 读取它时:
val df = spark.sql("select * from dbName.tableName")
读取hive表大约需要3个小时,而我使用hive sql读取这个表,它只需要几秒钟。
谁知道为什么 spark sql 和 hive sql 之间的性能差异如此之大?非常感谢!
【问题讨论】:
标签: apache-spark hive apache-spark-sql