【发布时间】:2016-03-17 00:50:57
【问题描述】:
假设我有一个包含两个重叠组的直方图。这是来自 ggplot2 的一个可能的命令和一个假装的输出图。
ggplot2(data, aes(x=Variable1, fill=BinaryVariable)) + geom_histogram(position="identity")
所以我所拥有的是每个事件的频率或计数。 我想做的是获取每个 bin 中两个事件之间的差异。这可能吗?怎么样?
例如,如果我们做 RED 减去 BLUE:
- x=2 处的值约为 -10
- x=4 处的值约为 40 - 200 = -160
- x=6 处的值约为 190 - 25 = 155
- x=8 处的值约为 10
我更喜欢使用 ggplot2 来执行此操作,但另一种方式也可以。我的数据框设置了类似这个玩具示例的项目(尺寸实际上是 25000 行 x 30 列)已编辑:这是要使用的示例数据 GIST Example
ID Variable1 BinaryVariable
1 50 T
2 55 T
3 51 N
.. .. ..
1000 1001 T
1001 1944 T
1002 1042 N
从我的示例中可以看出,我对一个直方图很感兴趣,可以分别为每个 BinaryVariable(T 或 N)绘制 Variable1(一个连续变量)。但我真正想要的是它们的频率之间的差异。
【问题讨论】: