【问题标题】:Assign subset of values to pandas dataframe with MultiIndex使用 MultiIndex 将值的子集分配给 pandas 数据框
【发布时间】:2018-12-10 14:55:20
【问题描述】:

我有一个 DataFrame df:

                             **Count**
**Environment** **Type**    
**A**            a           100
                 b           200
                 c           300
                 d           400
                 e           500
                 f           600
**B**            a           1000
                 b           2000
                 c           3000
                 d           4000
                 e           5000
                 f           6000

df.index 吐出以下索引:

    MultiIndex(levels=[['A', 'B'], ['a', 'b', 'c', 'd', 'e', 'f']],
               labels=[[0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1], 
                       [0, 1, 2, 3, 4, 5, 0, 1, 2, 3, 4, 5]],
               names=['A', 'B'])

我需要计算每个 A 和 B 的计数百分比。 所以我这样做:

sums = df.groupby(level = 0).sum()
df.loc['A'] = df.loc['A'].apply(lambda x: x/sums.loc['A','Count'])
df.loc['B'] = df.loc['B'].apply(lambda x: x/sums.loc['B','Count'])

但是,这会导致所有值都是NaN

我怀疑索引 df.loc['B'].apply(lambda x: x/sums.loc['B','Count'])df的索引不一样,但应该和我选择的df的部分一样。

这些都是自己

df.loc['A'].apply(lambda x: x/sums.loc['A','Count'])
df.loc['B'].apply(lambda x: x/sums.loc['B','Count'])

有我需要的值,所以除法有效。但是,赋值没有。

如何将上述表达式的结果赋值给dataframe部分 df

【问题讨论】:

  • 为什么不干脆做df/sums

标签: python pandas dataframe variable-assignment nan


【解决方案1】:

你可以简单地做df/sums,不需要循环。

由于您想分配给数据帧的特定部分,您可以这样做。保持计算的 df 1 级别的深度更高。

df.loc['A',:] = df.loc['A',:,:].apply(lambda x: x/sums.loc['A','Count'])

【讨论】:

    【解决方案2】:

    使用div赋值

    s=df.Count.div(df.Count.sum(level=0),axis=0,level=0)
    df['per']=s
    df
    Out[1253]: 
                              Count       per
    **Environment** **Type**                 
    A               a           100  0.047619
                    b           200  0.095238
                    c           300  0.142857
                    d           400  0.190476
                    e           500  0.238095
                    f           600  0.285714
    B               a          1000  0.047619
                    b          2000  0.095238
                    c          3000  0.142857
                    d          4000  0.190476
                    e          5000  0.238095
                    f          6000  0.285714
    

    【讨论】:

      猜你喜欢
      • 2013-05-09
      • 1970-01-01
      • 2017-09-21
      • 1970-01-01
      • 2013-06-19
      • 2021-04-12
      • 2016-08-26
      • 2021-12-04
      • 2020-05-19
      相关资源
      最近更新 更多