【发布时间】:2020-04-17 23:14:40
【问题描述】:
我试图弄清楚如何按一个变量分组并保留具有相同变化模式的所有其他变量。这是一个示例 df,其中 gp 是我的分组变量:
V1 V2 V3 V4 V5 V6 gp
1 0 1 0 0 0 0 x
2 0 0 0 0 1 0 x
3 1 0 1 0 1 1 y
4 0 0 0 0 0 1 x
我想结束的是:
V1 V3 gp
1 0 0 x
2 0 0 x
3 1 1 y
4 0 0 x
我尝试了很多东西,但没有任何东西能让我接近有用的东西。我的真实数据会更大,但我认为这是一个很好的起点。在这种情况下,我可以做一些数字,但我的“真实数据”是基因组数据,因此不像 0 和 1 那样容易添加。
数据:
structure(list(V1 = c(0L, 0L, 1L, 0L), V2 = c(1L, 0L, 0L, 0L),
V3 = c(0L, 0L, 1L, 0L), V4 = c(0L, 0L, 0L, 0L), V5 = c(0L,
1L, 1L, 0L), V6 = c(0L, 0L, 1L, 1L), gp = structure(c(1L,
1L, 2L, 1L), .Label = c("x", "y"), class = "factor")), class = "data.frame", row.names = c(NA,
-4L))
【问题讨论】:
-
对于'y'组,有不止一列有1
-
我知道,但我希望模式相同(即 0010 匹配 xxyx)