【发布时间】:2021-12-05 02:42:29
【问题描述】:
我有一个像这样的df:
ID Amount Date
1 23 3/1/2021 12:00PM
1 23 3/1/2021 12:01PM
1 23 3/1/2021 12:05PM
1 23 3/1/2021 12:09PM
1 24 3/2/2021 12:05PM
2 43 3/1/2021 12:00PM
2 43 3/1/2021 12:01PM
2 432 3/1/2021 12:05PM
我想在特定时间窗口(5 分钟或更短)内识别重复项。 除了查找重复项之外,我还需要计算该组中重复项的数量并标记父重复项。
我的初步输出是:
我想要的输出是:
我参考了下面的链接以获得初步输出,但很难找到所需的输出:
- pandas dataframe: duplicates based on column and time range
- Drop duplicate rows from a pandas DataFrame whose timestamps are within a specified range or duration
任何帮助将不胜感激。
【问题讨论】: