【发布时间】:2013-06-29 06:45:18
【问题描述】:
我无法将直方图绘制为 pdf(概率)
我希望所有部分的总和等于一的面积,这样更容易跨数据集进行比较。出于某种原因,每当我指定中断(默认值为 4 或其他任何糟糕的值)时,它不再希望将 bin 绘制为概率,而是将 bin 绘制为频率计数。
hist(data[,1], freq = FALSE, xlim = c(-1,1), breaks = 800)
我应该将此行更改为什么?我需要一个概率分布和大量的垃圾箱。 (我有 600 万个数据点)
这在 R 帮助中,但我不知道如何覆盖它:
频率逻辑;如果为 TRUE,直方图图形是 频率,结果的计数分量;如果为假,概率 密度,组件密度,被绘制(以便直方图具有 总面积一)。当且仅当中断时默认为 TRUE 等距(并且未指定概率)。
谢谢
编辑:详细信息
嗯,所以我的情节高于 1,如果这是一个概率,这将非常令人困惑。我现在看到它与 bin 宽度有什么关系。我或多或少想让每个垃圾箱都值 1 分,同时仍然有很多垃圾箱。换句话说,任何 bin 高度都不应高于 1.0,除非它直接位于 1.0 并且所有其他 bin 均为 0.0。就目前而言,我有一个在 15.0 左右形成驼峰的垃圾箱
编辑:bin 中的 %points 高度 @Dwin:那么我如何绘制概率?我意识到由于 x 轴上的单位,积分仍然会给我 1.0,但这不是我想要的。假设我有 100 个点,其中 5 个点落入第一个箱中,那么该箱的高度应为 0.05。这就是我要的。我做错了吗,还有另一种方法吗?
我知道我有多少分。有没有办法将频率直方图中的每个 bin 计数除以这个数字?
【问题讨论】:
-
这是一个密度,而不是概率。 (澄清一下:xf(x) 的积分在某个点上 >1.0 的事实并不意味着 f(x) 必须在所有 x 上都小于 1.0。xf 的积分(x) 在任何范围内,有限或无限都将小于或等于 1.0。)