【发布时间】:2021-11-13 12:30:10
【问题描述】:
我正在尝试使用 spark sql 从 pyspark 数据框创建一个配置单元分区表。以下是我正在执行的命令,但出现错误。错误信息如下。
df.createOrReplaceTempView(df_view)
spark.sql("create table if not exists tablename PARTITION (date) AS select * from df_view")
错误:pyspark.sql.utils.ParseException:u"\nmismatched input 'PARTITION' expecting <EOF>
当我尝试在上述行中不使用 PARTITION (date) 运行时,它工作正常。但是我无法使用分区创建。
如何创建带有分区的表并将日期从.pyspark 数据帧插入到 hive。
【问题讨论】:
标签: apache-spark pyspark hive