【发布时间】:2020-11-12 11:40:14
【问题描述】:
我有一种情况,我需要对数据进行透视,以便在日期字段的基础上获取最近的和最近的条目。我的数据框如下所示:
State country Date confirmed deaths recover
A C 1/22/20 1 0 0
A C 1/23/20 1 0 0
A C 1/24/20 15 0 0
A C 1/25/20 39 0 0
B C 1/26/20 60 0 0
B C 1/27/20 70 0 0
B C 1/28/20 106 0 0
B C 1/29/20 152 2 0
B C 1/30/20 200 2 0
我想要的输出应该是这样的: 因此,新的列已确认,死亡和恢复应该根据 Max(Date) 获取值,该值是状态 A 的 1/25/20 和状态 B 的 1/30/20 和 newcases , newdeaths , newrecover 应该是最大日期值的差 - 秒到最大日期值。
For example for state A new cases = 39-15= 24, newdeaths = 0-0=0 , newrecover = 0-0=0
39 例在最大日期,24 例在最大日期的第二个,因为我需要获得每日更改。这应该是动态的,因为它需要每天获取
State country confirmed deaths recover newcases newdeaths newrecover
A C 39 0 0 24 0 0
B C 200 2 0 48 2 0
【问题讨论】:
-
对于 B 列 B,newdeaths 是否应该为 0,因为
2-2=0?
标签: python-3.x pandas pivot pivot-table aggregate