【问题标题】:How do I create a databricks table from a pandas dataframe?如何从 pandas 数据框创建数据块表?
【发布时间】:2020-09-11 04:59:40
【问题描述】:

我创建了一个 pandas 数据框。这打印得很好,但是我需要在 SQL 中进行操作。

我已经运行了以下内容:

spark_df = spark.createDataFrame(df)

spark_df.write.mode("overwrite").saveAsTable("temp.testa")

pd_df = spark.sql('select * from temp.testa').toPandas()

但是得到一个错误:

AnalysisException: Database 'temp' not found;

显然我还没有创建数据库,但不知道该怎么做。

任何人都可以建议我如何实现我所需要的吗?

【问题讨论】:

    标签: pandas pyspark databricks azure-databricks


    【解决方案1】:

    错误消息清楚地显示“AnalysisException: Database 'temp' not found;”数据库临时未找到。创建数据库后,您可以毫无问题地运行查询。

    要创建数据库,可以使用以下命令:

    在 SQL 中创建数据库:

    CREATE DATABASE <database-name>
    

    参考:Azure Databricks - SQL

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2015-10-12
      • 2018-10-28
      • 2018-03-02
      • 2018-11-13
      • 1970-01-01
      • 2021-11-22
      • 1970-01-01
      相关资源
      最近更新 更多