【发布时间】:2015-10-15 14:16:40
【问题描述】:
假设我有一个如下所示的数据框:
data <- data.frame(y = rnorm(10,0,1), x = runif(10,0,1))
我想做的是将x值切割成bin,例如:
data$bins <- cut(data$x,breaks = 4)
然后,我想绘制(使用 ggplot)结果,其中 x 轴是 bin,y 轴是落入相应 bin 的 data$y 数据点的平均值。
提前谢谢你
【问题讨论】:
-
我看到你的问题要求削减价值,然后绘制平均值。使用
hist函数(如> tmp <- hist(data.x, breaks="Sturges"))中的标准算法,然后使用idxs = findInterval(data.x, tmp$breaks)之类的算法,在统计上更合理的方法。然后使用 ggplot 中 x 坐标的索引:tmp$mids[idxs]和 y 的平均值,使用@christoph 建议的解决方案。