【发布时间】:2022-08-13 02:50:51
【问题描述】:
我有一个数据框\'merged_df\'看起来像这样:
| Login ID | Volume |
|---|---|
| cab001 | 4 |
| cab002 | 3 |
| cab001 | 4 |
| cab003 | 2 |
里面有很多重复的登录ID柱子。我想制作另一个只有唯一 \'login_id\' 的数据框和每个唯一 \'login_id\' 的 \'volume\' 总和。
我有一个数据框\'merged_df\'看起来像这样:
| Login ID | Volume |
|---|---|
| cab001 | 4 |
| cab002 | 3 |
| cab001 | 4 |
| cab003 | 2 |
里面有很多重复的登录ID柱子。我想制作另一个只有唯一 \'login_id\' 的数据框和每个唯一 \'login_id\' 的 \'volume\' 总和。
这会让你得到你想要的吗?
df = pd.DataFrame({
'login_id' : [1, 1, 2, 2, 3],
'Volumn' : [10, 10, 20, 20, 50]
})
df_new = df.groupby('login_id', as_index = False)['Volumn'].sum().sort_values('Volumn', ascending = False)
【讨论】: