【问题标题】:Pandas DataFrame plot: specify column from MultiIndex for secondary_yPandas DataFrame 图:从 MultiIndex 中为 secondary_y 指定列
【发布时间】:2018-11-02 03:40:49
【问题描述】:

我正在绘制一个多索引列 DataFrame。

使用pandas DataFrame 的.plot 方法指定要在secondary_y 上绘制的列的语法是什么?

设置

import numpy as np
import pandas as pd

mt_idx = pd.MultiIndex.from_product([['A', 'B'], ['first', 'second']])
df = pd.DataFrame(np.random.randint(0, 10, size=(20, len(mt_idx))), columns=mt_idx)

我的尝试

df.plot(secondary_y=('B', 'second'))
df.plot(secondary_y='(B, second)')

上述方法均无效,因为所有线都绘制在主 y 轴上。

【问题讨论】:

  • 根据文档,您应该能够使用传递元组或列表的形式。但我也试过了,还是不行。

标签: python pandas matplotlib multi-index


【解决方案1】:

您可能会drop the upper column index level。如果您不想修改原始数据框,可以在其副本上完成。

df2 = df.copy()
df2.columns = df2.columns.map('_'.join)

df2.plot(secondary_y=('B_second'))

【讨论】:

  • df2.columns = df2.columns.map('_'.join) 更干净 :)
【解决方案2】:

一种可能的解决方案是绘制每一列,然后指定secondary=True。按照以下方式执行此操作需要您指定它们将被绘制到的轴:

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

fig, ax = plt.subplots()

mt_idx = pd.MultiIndex.from_product([['A', 'B'], ['first', 'second']])
df = pd.DataFrame(np.random.randint(0, 10, size=(20, len(mt_idx))), columns=mt_idx)

df.A.plot(ax=ax)
df.B.plot(ax=ax, secondary_y=True)

plt.show()

【讨论】:

    猜你喜欢
    • 2019-02-08
    • 2013-03-22
    • 2016-11-06
    • 1970-01-01
    • 2019-08-02
    • 2019-05-20
    • 2017-08-25
    • 1970-01-01
    • 2020-05-26
    相关资源
    最近更新 更多