【发布时间】:2021-11-08 16:18:02
【问题描述】:
关于这种类型的数据框:
import pandas as pd
import datetime
df = pd.DataFrame({'ID': [1,1,1,1,2,2,2,3],
'Time': [datetime.date(2019, 12, 1), datetime.date(2019, 12, 5),datetime.date(2019, 12, 8),datetime.date(2019, 8, 4),datetime.date(2019, 11, 4),datetime.date(2019, 11, 4),datetime.date(2019, 11, 3),datetime.date(2019, 12, 20)],
'Value':[2,2,2,50,7,100,7,5]})
ID Time Value
0 1 2019-12-01 2
1 1 2019-12-05 2
2 1 2019-12-08 2
3 1 2019-08-04 50
4 2 2019-11-04 7
5 2 2019-11-04 100
6 2 2019-11-03 7
7 3 2019-12-20 5
我只对最新的 3 个值感兴趣(关于时间)
和
我只想保留这 3 个值
所以我想要的输出将如下所示:
ID
0 1
确实,第一个 ID 的值 50 是倒数第四个值,所以它并不有趣。
【问题讨论】:
标签: python pandas dataframe pandas-groupby apply