【发布时间】:2021-02-04 03:01:55
【问题描述】:
我正在尝试在 Glue 目录中使用 hive 在 EMR 中运行的 spark 的 s3 路径位置创建一个表。我尝试了以下命令,但出现错误:
pyspark.sql.utils.AnalysisException: u'java.lang.IllegalArgumentException: Can not create a Path from an 空字符串;'
sparksession.sql("CREATE TABLE IF NOT EXISTS abc LOCATION 's3://my-bucket/test/' as (SELECT * from my_table)")
sparksession.sql("CREATE TABLE abcSTORED AS PARQUET LOCATION 's3://my-bucket/test/' AS select * from my_table")
sparksession.sql("CREATE TABLE abcas SELECT * from my_table USING PARQUET LOCATION 's3://my-bucket/test/'")
有人可以建议我缺少的参数吗?
【问题讨论】:
-
顺便说一句,您不需要路径中的最后一个斜杠。
LOCATION 's3://my-bucket/test' -
还是不行。错误是一样的
标签: amazon-web-services pyspark hive aws-glue-data-catalog aws-glue-spark