【问题标题】:Calculate mean of new variable for cells of contingency table计算列联表单元格的新变量的平均值
【发布时间】:2016-12-23 00:35:09
【问题描述】:

我正在尝试用绘图中的彩色气泡总结李克特量表评级数据。我目前有一个小提琴图覆盖在一个抖动的多面散点图上,这为我试图传达的内容提供了一个近距离的失误。

理想情况下,我会为李克特量表上的每个点设置气泡,大小由具有该分数的项目的数量(或比例)决定,并由 spKnownShown 变量的平均值着色。为 Likert-facet-x-axis 组合制作列联表很简单,但是如何将每个单元格链接到 spKnownShown 的平均值?任何有关从列联表中将下一个飞跃变为实际情节的建议将不胜感激。

很抱歉我不能分享这些数据,因为它是根据保密协议。

【问题讨论】:

  • 您能否发布一些大致代表您正在尝试使用的数据的数据?

标签: r ggplot2 mosaic-plot


【解决方案1】:

考虑使用 dplyr 包中的函数。我首先制作了一个假数据集,其中 x、y、v 和 f 分别对应于 x 轴、Likert、您想要平均值的值和 facet。

library(ggplot2)
library(dplyr)
n <- 1000
set.seed(1)
d <- data.frame(x = sample(0:1, n, r = T),
                y = pmin(rpois(n, 2), 6),
                v = rnorm(n),
                f = sample(0:2, n, r = T))

创建您想要的值是使用来自dplyrgroup_bysummarise 的组合:

plt <- d %>% group_by(f, x, y) %>%
  summarise(n = n(), v = mean(v))

最后,剧情:

ggplot(plt, aes(x = factor(x), y = factor(y), size = n, colour = v)) +
  geom_point() +
  facet_wrap("f") 

【讨论】:

  • 非常感谢......如果您希望图中每列中的点大小(因子(x))反映它们在列计数中的比例,而不是原始计数?
  • 如何计算比例可以参考这个问题dplyr:stackoverflow.com/questions/24576515/…
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2013-05-10
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多