【发布时间】:2019-11-05 15:11:31
【问题描述】:
我制作了一个包含 3 列的示例数据框:颜色、值和大小。行用数值、文本和空单元格填充。
Colour Value Size
Red 1 Big
Red nd Small
Blue nd Big
Blue NA Big
Blue 1 Medium
Yellow 1 NA
Yellow 2 Big
Green NA NA
Green nd Medium
颜色列具有重复的颜色,这些颜色在值列中可以具有不同的值。
如果在 Value 列中找到数值,那么我想选择该行以及具有相同颜色的非数值的行。所以新的数据框看起来像这样:
Colour Value Size
Red 1 Big
Red nd Small
Blue nd Big
Blue NA Big
Blue 1 Medium
Yellow 1 NA
Yellow 2 Big
因此,例如,如果 1 行具有红色的数值,那么我想为红色、数字和非数字选择每一行。
如果一种颜色根本没有数值,那么它将被完全丢弃,例如我的示例中的绿色。
有什么想法可以做到这一点吗?
【问题讨论】:
-
您的数据(值列)实际上是数字而不是字符吗?我不确定层次结构,但考虑到 nd 的存在,这不会是字符而不是数字吗?如果是字符,我猜你可能会使用 RegEx 来匹配数字。
-
我的小错误,此实例中的数值尚未设置为数字
标签: r duplicates