【发布时间】:2011-08-31 18:13:38
【问题描述】:
我需要找到“90% 样本的最高 bin”。
我有一张这样的桌子:
my_table <- data.frame(matrix(c(122,68,2,0,30,0,0,0,5,79,23,9000), byrow=TRUE, ncol=4))
names(my_table) <- c("0-10","11-20","21-30","31-5000")
bin-header 表示分钟(时间)。
对于第一行,90% 的样本间隔小于或等于“11-20”。 IE。 90% 的样本时间少于 21 分钟。
对于第二行,它小于或等于区间“0-10”。
对于第三行,它小于或等于区间“31-5000”。
我想添加一列“90p-interval”,其中自动找到上述间隔,导致表格如下:
my_table$Perc90 <- c("11-20","0-10","31-5000")
我的真实表格有成千上万行。
如果有人可以提供帮助,我将非常感激,也感谢为这个出色网站做出贡献的每个人!
/克里斯
【问题讨论】:
-
如果在单个区间内没有 > 90% 会怎样?说,
my_table <- rbind(my_table, c(80, 10, 0, 10)) -
如果您查看示例数据框中的第一行,就会发生这种情况。提问者找到达到 90%(包括所有之前)的 bin,即正确答案。
标签: r