【发布时间】:2018-12-10 14:55:20
【问题描述】:
我有一个 DataFrame df:
**Count**
**Environment** **Type**
**A** a 100
b 200
c 300
d 400
e 500
f 600
**B** a 1000
b 2000
c 3000
d 4000
e 5000
f 6000
df.index 吐出以下索引:
MultiIndex(levels=[['A', 'B'], ['a', 'b', 'c', 'd', 'e', 'f']],
labels=[[0, 0, 0, 0, 0, 0, 1, 1, 1, 1, 1, 1],
[0, 1, 2, 3, 4, 5, 0, 1, 2, 3, 4, 5]],
names=['A', 'B'])
我需要计算每个 A 和 B 的计数百分比。 所以我这样做:
sums = df.groupby(level = 0).sum()
df.loc['A'] = df.loc['A'].apply(lambda x: x/sums.loc['A','Count'])
df.loc['B'] = df.loc['B'].apply(lambda x: x/sums.loc['B','Count'])
但是,这会导致所有值都是NaN。
我怀疑索引
df.loc['B'].apply(lambda x: x/sums.loc['B','Count'])和df的索引不一样,但应该和我选择的df的部分一样。
这些都是自己
df.loc['A'].apply(lambda x: x/sums.loc['A','Count'])
df.loc['B'].apply(lambda x: x/sums.loc['B','Count'])
有我需要的值,所以除法有效。但是,赋值没有。
如何将上述表达式的结果赋值给dataframe部分 df?
【问题讨论】:
-
为什么不干脆做
df/sums?
标签: python pandas dataframe variable-assignment nan