【问题标题】:how do i set data and index into pandas dataframe如何将数据和索引设置为 pandas 数据框
【发布时间】:2020-05-24 11:11:45
【问题描述】:

我有这样的查询

test = spark.sql("select mg.moviegenreid, sum(quantity) as total \
                from moviegenre mg \
                join movie m on m.moviegenreid = mg.moviegenreid \
                join detailtransaction dt on dt.movieid = m.movieid \
                join headertransaction ht on ht.transactionid = dt.transactionid \
                group by mg.moviegenreid \
                having sum(quantity) \
                order by total desc \
                limit 5")

然后我将它插入到 pandas 数据帧中

data = test.toPandas()

我只想使用

制作小节线
x = data[{"moviegenreid"}]
y = data[{"total"}
val = pd.DataFrame(data=y,index=x)
val.plot.bar()

我总是遇到这样的错误

ValueError: Index data must be 1-dimensional

【问题讨论】:

    标签: python pandas apache-spark-sql


    【解决方案1】:

    {试试:

    x = data["moviegenreid"]
    y = data["total"]
    val = pd.DataFrame({'data'=y},index=x)
    val.plot.bar()
    

    【讨论】:

    • 它的工作很完美,但是,任何不同的 data[{"moviegenreid"}] 与 data["moviegenreid"] 是如何工作的。非常感谢你:)
    猜你喜欢
    • 2021-12-31
    • 2016-02-29
    • 2016-12-31
    • 2021-10-08
    • 2019-12-16
    • 2014-10-05
    • 2020-04-19
    • 2020-10-22
    • 1970-01-01
    相关资源
    最近更新 更多