【问题标题】:How to manipulate 2 column data frame in Jupyter notebooks Python [duplicate]如何在 Jupyter 笔记本 Python 中操作 2 列数据框 [重复]
【发布时间】:2020-08-29 16:04:18
【问题描述】:

我有一个数据框,我正在尝试对其进行操作,以显示在黑暗和光照条件下发生的事故的严重程度差异。

这是有 200k 个条目的 df。

SEVERITYCODE    LIGHTCOND
0   Injury  Light
1   Damage  Dark
2   Damage  Light
3   Damage  Light
4   Injury  Light
5   Damage  Light
6   Damage  Light
7   Injury  Light
8   Damage  Light
9   Injury  Light
10  Damage  Light
11  Damage  Light
12  Damage  Dark
13  Damage  Dark
14  Injury  Dark
15  Damage  Dark
16  Injury  Light
17  Damage  Light
18  Injury  Light
19  Damage  Dark
20  Injury  Dark

我需要能够将这些数据输入 df 以查看类似这样的内容,其中暗伤的发生次数在左上角的框中,黑暗和损坏在右上角的框中,并且以此类推。

       Injury   Damage
Dark:   10023   1132
Light:  1234    98474

如何让 Python 对这样的列进行计数?我不确定是否需要包含图片中的数据来帮助我。1

然后我想把它做成一个堆叠条形图,以便于可视化,我想我可以通过其他教程来管理。

谢谢

【问题讨论】:

    标签: python pandas dataframe jupyter-notebook


    【解决方案1】:
    (
        df.groupby(['LIGHTCOND', 'SEVERITYCODE']) # create a groubpy object
        .size() # aggregate by counting the rows in each group
        .unstack() # move the inner-most index level to columns, i.e. 'SEVERITYCODE'
    )
    

    【讨论】:

    • 你是个奇迹里奇。我看到 unstack() 命令将它们加起来。谢谢
    【解决方案2】:

    试试crosstab

    s = pd.crosstab(df['LIGHTCOND'], df['SEVERITYCODE'])
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2021-04-24
      • 1970-01-01
      • 1970-01-01
      • 2021-07-27
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多