【发布时间】:2018-01-21 15:59:13
【问题描述】:
我想为我的dataframe df['days_since_last'] 构建一个列,显示自每个 player_id 的最后一场比赛以来的天数,每个 event_id 和 nan 如果该行是数据集中玩家的第一个比赛。
我的数据示例:
event_id player_id match_date
0 1470993 227485 2015-11-29
1 1492031 227485 2016-07-23
2 1489240 227485 2016-06-19
3 1495581 227485 2016-09-02
4 1490222 227485 2016-07-03
5 1469624 227485 2015-11-14
6 1493822 227485 2016-08-13
7 1428946 313444 2014-08-10
8 1483245 313444 2016-05-21
9 1472260 313444 2015-12-13
我尝试了Find days since last event pandas dataframe 中的代码,但得到了无意义的结果。
【问题讨论】:
-
您是否尝试先按 match_date 对每个组进行排序?
-
我认为您首先需要
df = df.sort_values(['event_id','player_id']),但是您可以添加预期的输出吗?
标签: pandas