【发布时间】:2019-03-28 18:44:23
【问题描述】:
在下面的数据集中,我想首先检查哪些行对于列U 和T 具有相同的值。对于所有这些行,我想计算 Mean 列的平均值、Min 列的最小值和 Max 列的最大值。
如果列U 和T 具有相同值的行是分开的data.frame(),我可以轻松做到这一点,但对于这种情况,我首先需要提取所有此类子data.frame() 和data.frame() 和然后执行操作。
如果有人使用R 库有更好的方法请提出建议?
输入数据
data <- structure(list(A = c(0.1, 0.1, 0.1, 0.1), B = c(NA, NA, NA, NA
), C = structure(c(1L, 1L, 1L, 1L), .Label = "Yes", class = "factor"),
U = c(11L, 11L, 11L, 11L), T = structure(c(1L, 1L, 1L, 1L
), .Label = "A", class = "factor"), P = structure(c(1L, 1L,
1L, 1L), .Label = "INT", class = "factor"), Q = 1:4, R = c(0L,
0L, 0L, 0L), S = c(1L, 1L, 1L, 1L), W = structure(c(1L, 1L,
1L, 1L), .Label = "A", class = "factor"), Mean = c(21.208,
21.22333333, 21.23666667, 21.174), Min = c(21.02, 21.01,
21.09, 21.02), Max = c(21.35, 21.39, 21.47, 21.36)), class = "data.frame", row.names = c(NA,
-4L))
预期输出
A B C U T P Q R S T Mean Min Max
0.1 NA Yes 11 A INT 4 0 1 A 21.2105 21.01 21.47
【问题讨论】:
-
你是怎么得到这个数据集的?
-
.@akrun - 我显示的输出基本上是首先计算
Mean列的平均值,然后是Min列的最小值,然后是Max列的最大值。这就像对三个不同行的三向参数计算。我显然使用 excel 来显示预期的输出。 -
看起来很有趣
-
.@akrun - 这很有挑战性,而且对你来说很有趣,我当然不可能为此编写
R代码:-(。