【发布时间】:2019-06-22 20:18:23
【问题描述】:
我正在尝试根据因子变量的存在来删除重复的行。如果重复行中的因子变量显示 desired,而不是 not desired,我想保留该行并删除另一行。所需的因子有时会显示为第一个副本,有时会显示为第二个。
此外,一旦弹出要么想要的或不想要的,就会有一列开始计算三十天。在没有类型(NA)的情况下,重复标志列也会显示NA。
最后,每个品牌每天应该有 1 行。
手头的数据样本:
brand date sales orders customers type duplicate_flag
A 10/1/2018 100 5 4 NA NA
A 10/2/2018 150 8 6 desired 1
A 10/2/2018 150 8 6 not desired 1
A 10/3/2018 110 5 4 NA 2
期望的输出:
brand date sales orders customers type duplicate_flag
A 10/1/2018 100 5 4 NA NA
A 10/2/2018 150 8 6 desired 1
A 10/3/2018 110 5 4 NA 2
如果 dplyr 有办法做到这一点,那就太好了。
谢谢!
【问题讨论】:
标签: r filter dplyr duplicates distinct