【发布时间】:2017-05-29 19:49:23
【问题描述】:
我有关于在火车事故中丧生的人及其年龄的数据。
例如:
file <- data.frame(
Survived = sample(0:1, 100, replace=TRUE),
Age = sample(0:100, 100, replace=TRUE))
我想在 R 中创建一个直方图,其中每个 bin 衡量死亡人数占 bin 范围内包含的数据集中总人数的百分比。
这是我目前所拥有的:
hist(file[which(file$Survived==1),]$Age, freq=FALSE)
但这只会返回一个直方图,其值占整个数据集的百分比。像这样:Histogram of Sample Data
我需要特定年龄组的百分比,这样如果所有 0-10 岁的人都死了,那么该年龄组的直方图条将是 100%。
【问题讨论】:
-
查看
hist()函数设置freq参数FALSE。hist(yourvariable,freq=F) -
我知道如何获取整个数据集的百分比。我正在寻找 bin 中包含的数据百分比。
-
例如 20-40 岁的死亡人数除以数据集中 20-40 岁的人数
-
请在您的帖子中包含一个可重现的示例:stackoverflow.com/help/mcve
-
如果您使用包,您会发现这更容易。具体来说,
dplyr和ggplot2。例如,请参阅这个非常相似的问题:stackoverflow.com/questions/41030350/…