【发布时间】:2020-02-09 03:16:36
【问题描述】:
我有一个如下所示的数据集
ID. Invoice. Date of Invoice. paid or not.
1 1 10/31/2019 yes
1 1 10/31/2019 yes
1 2 11/30/2019 no
1 3 12/31/2019 no
2 1 09/30/2019 no
2 2 10/30/2019 no
2 3 11/30/2019 yes
3 1 7/31/2019 no
3 2 9/30/2019 yes
3 3 12/31/2019 no
我想知道客户是否愿意付款。客户只要补了新的发票,旧的发票没付,我会给他一个好分数。所以对于客户 2 和 3,我给了“好”,客户 2 是“坏”的分数。
所以最终数据将多出一列,其值分别为好和坏。
ID. Invoice. Date of Invoice. paid or not. Bad or good
1 1 10/31/2019 yes bad
1 1 10/31/2019 yes bad
1 2 11/30/2019 no bad
1 3 12/31/2019 no bad
2 1 09/30/2019 no good
2 2 10/30/2019 no good
2 3 11/30/2019 yes good
3 1 7/31/2019 no good
3 2 9/30/2019 yes good
3 3 12/31/2019 no good
【问题讨论】:
-
这与您posted yesterday 的问题有何不同,除了数据样本略小?
-
嗨@camille,我也注意到了。这是怎么回事?亲爱的玉芳,如果有人在上一篇文章中回答了您的问题,请采纳。如果这里有一个单独的问题,我希望我已经以某种方式解决了它。三个版本的代码游来游去,重复工作是不好的。
-
您好,对不起,我昨天发布了,但答案并没有解决问题。所以我在这篇文章中添加了更多细节。抱歉,如果它是重复的。我应该删除另一个帖子吗?