【发布时间】:2021-02-12 23:08:32
【问题描述】:
我有两个 python pandas 数据框,它们的简化形式如下所示:
DF1
+---------+---------+------+-------+
| Date_in | Date_out| Group| Item |
+---------+---------+------+-------+
| 1991-08 | 2000-08 | A | A1 |
| 1992-08 | NaT | A | A2 |
| 1997-02 | NaT | B | B1 |
| 1998-03 | 2001-03 | C | C1 |
| 1999-02 | 2002-02 | D | D1 |
| 2000-02 | NaT | D | D2 |
| 2000-03 | 2001-04 | D | D3 |
| 2001-08 | NaT | D | D4 |
+---------+---------+------+-------+
DF2
+---------+-------+
| Date | Group |
+---------+-------+
| 2000-01 | A |
| 2001-02 | A |
| 2001-03 | B |
| 2001-04 | B |
| 2001-05 | C |
| 2001-06 | C |
| 2001-03 | D |
| 2001-07 | D |
+---------|-------+
我想根据 DF1 中的日期约束计算组列 DF2 中还存在多少项目
期望的输出
+---------+-------+-------+
| Date | Group | Total |
+---------+-------+-------+
| 2000-01 | A | 2 |
| 2001-02 | A | 1 |
| 2001-03 | B | 1 |
| 2001-04 | B | 1 |
| 2001-05 | C | 0 |
| 2001-06 | C | 0 |
| 2001-03 | D | 3 |
| 2001-07 | D | 2 |
+---------|-------+-------+
【问题讨论】:
-
获得所需输出的逻辑是什么?
-
是的,@jezrael 先生,因为 A1(2000-08 年推出)在 2000-01 年仍然存在
-
知道了。刚刚想通了。我认为@jezrael 太快了。他已经回答了
-
@JoeFerndz - Nat 表示仍然存在
标签: pandas dataframe map-function