【发布时间】:2020-03-25 00:36:48
【问题描述】:
我需要根据包含两列的条件进行分组,例如,我有以下数据框:
item start_date end_date
A 10/03/2019 31/03/2019
B 10/03/2019 31/03/2019
A 31/03/2019 10/04/2019
B 31/03/2019 10/04/2019
如果 end_date 等于 start_date 并且结果行应该具有第一行的 start_date 和第二行的 end_date,我需要对项目进行分组
item start_date end_date
A 10/03/2019 10/04/2019
B 10/03/2019 10/04/2019
一个更简单的例子:
item start_date end_date
A a b
A b c
A d e
A e f
想要的结果:
item start_date end_date
A a c
A d f
【问题讨论】:
-
那是怎样的groupby?听起来更像是一个过滤器。同样在您的示例数据中,没有一行满足该条件,那么您如何达到预期结果?还是您的意思是“每月的同一天”?
-
对于第一个项目
A,end_date等于第二个项目A的start_date,因此我们分组并为结果行提供第一个@ 的start_date987654330@ 和第二个A的end_date。 -
我正在调查这是否是我需要的答案
-
@a_guest 这几乎是一个解决方案,但在我的情况下它不起作用,因为该项目可以在不同的日期间隔内重复,就像我在问题中更新的那样,这个解决方案将分组所有.
-
@a_guest 做更多测试,我确保它适用于所有情况,这是我需要的解决方案,谢谢!
标签: python-3.x pandas