【发布时间】:2021-02-18 06:34:19
【问题描述】:
我有一个这样的数据框,
df
col1 col2 col3
A 2021-02-01 P
B 2021-02-12 P
C 2021-02-08 Q
A 2021-02-04 Q
B 2021-02-14 Q
A 2021-02-15 S
col2 是 pandas 日期时间类型。现在我想在 col1 和 col2 上对 col3 值进行分组(日期日期范围为 +- 4 天,例如:2021-02-01 和 2021-02-04 之间的 col3 值应根据 col1 值分组)
所以最终的数据框应该是这样的,
col1 col3
A [P,Q]
B [P,Q]
C [Q]
A [S]
这可以使用 for 循环并检查日期时间差异来完成,但执行时间会很长,因此请寻找 pandas 快捷方式来更有效地执行此操作。
【问题讨论】:
-
有关于
with date date range of +- 4 days的讨论,可以多解释一下吗?