【发布时间】:2021-12-29 16:27:08
【问题描述】:
考虑以下数据框:
| id | cat | date | max | score | |
|---|---|---|---|---|---|
| 1 | s1 | A | 12/06 | 9 | 5.4 |
| 2 | s1 | B | 12/06 | 10 | 5.4 |
| 3 | s2 | C | 11/04 | 13 | 4.2 |
| 4 | s2 | D | 11/04 | 28 | 10 |
| 5 | s3 | E | 08/02 | 16 | 5.4 |
| 5 | s3 | F | 08/02 | 6 | 5.4 |
我想按“id”分组并获得第一个列 [cat, date] 但同时我想获得 max - score 列的平均值。 我认为可以通过聚合来完成:
但是通过聚合我无法访问数据框的所有列。
| id | cat | date | mean(max-score) |
|---|---|---|---|
| s1 | A | 12/06 | 4.1 |
| s2 | C | 11/04 | 13.4 |
| s3 | E | 08/02 | 5.6 |
【问题讨论】:
标签: python pandas group-by pandas-apply