【问题标题】:Limit categories in histogram for R限制 R 直方图中的类别
【发布时间】:2019-03-20 14:38:39
【问题描述】:

我在使用 R 中的直方图函数时遇到问题。

我有一个数据集,其中包含每个集合中的个体数量,值范围从 0 到 17。 我想将它们分成类别(0-4,5-9,10-14 等...),因为每个类别都包含 5 个数字,这很公平。

但是,当我在 R 中使用 hist 函数时,它会自动分类为 0-5,6-10,11-15 等...这不是我想要的。 我在直方图函数中尝试了“seq”和“break”,但对我来说效果不佳。

您有什么想法/建议可以帮助管理我的直方图吗?您认为 0-4,5-9 等可以吗,或者您认为 R 在处理我的数据方面是否正确?

我不希望拆分成任何较小的 bin,因为我想对我的数据进行卡方检验,并且类别过多会导致预期值变小。

hist(data,main="Histogram", xlab = "individuals", 
     ylab ="Count", border="black", col="red", xlim=c(0,20), ylim=c(0,10))


Set Individuals
1   2
2   5
3   9
4   6
5   17
6   2
7   13
8   6
9   0
10  1
11  2
12  1
13  2
14  2
15  15

【问题讨论】:

标签: r histogram


【解决方案1】:

您可以使用 hist 函数中的 breaks 参数来配置您的 bin。您需要提供一个包含变化值的列表。因此,如果您有整数并且想要 0-4、5-9 ...您可以使用(此处的数据介于 0 和 10 之间):

> seq(-0.5, max(data)+5, 5)
[1] -0.5  4.5  9.5 14.5

然后是您选择的任何其他参数:

hist(data, breaks=seq(-0.5,max(data)+5,5))

【讨论】:

    猜你喜欢
    • 2022-08-10
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-07-12
    • 1970-01-01
    • 2013-06-17
    相关资源
    最近更新 更多