【发布时间】:2021-04-10 13:50:18
【问题描述】:
我在下面有一个示例 df:
| date | group | price |
|------------|--------|-------|
| 11/25/2020 | cars | 3 |
| 11/25/2020 | trucks | 2 |
| 11/26/2020 | cars | 5 |
| 11/26/2020 | trucks | 2 |
| 11/27/2020 | cars | 3 |
| 11/27/2020 | trucks | 4 |
我的最终目标是按日期获得每个组的滚动累积价格平均值。我想要的输出如下:
| date | group | avg_price |
|------------|--------|-----------|
| 11/25/2020 | cars | 3 |
| 11/26/2020 | cars | 4 |
| 11/27/2020 | cars | 3.67 |
| 11/25/2020 | trucks | 2 |
| 11/26/2020 | trucks | 2 |
| 11/27/2020 | trucks | 2.67 |
我最初的想法是使用df.itertuples() 循环遍历df,同时使用带有日期范围的while loop,但我无法完全弄清楚。如果有人对最快的方法有任何提示/建议,将不胜感激,谢谢!
【问题讨论】:
-
您是否尝试过这种方法,将日期列转换为数据帧的索引,然后使用滚动函数来获得所需的频率?编辑:检查这个stackoverflow.com/questions/65343387/…