【发布时间】:2015-02-12 11:34:31
【问题描述】:
提供了the following 数据框(见下文),该数据框取自询问来自不同社区的人们的感知安全性的问卷,我设法创建了一个条形图,显示每个社区的感知安全性和分组结果:
questionnaire_raw = read.csv("https://www.dropbox.com/s/l647q2omffnwyrg/local.data.csv?dl=0")
ggplot(data = questionnaire_raw,
aes(x = factor(Seguridad.de.tu.barrio..de.día.), # We have to convert x values to categorical data
y = (..count..)/sum(..count..)*100,
fill = neighborhoods)) +
geom_bar(position="dodge") +
ggtitle("Seguridad de día") +
labs(x="Grado de seguridad", y="% encuestados", fill="Barrios")
我想将这些结果与代表所有邻域中每个安全类别(1、2、3 或 4)的平均值的折线图重叠(即没有对结果进行分组),因此很容易知道是否存在特定社区高于或低于所有社区的平均水平。但是,由于这是我使用 R 的第一份工作,我不知道如何使用数据框计算该平均值,然后将其覆盖在上一个条形图中。
【问题讨论】:
-
添加类似
+ stat_summary(fun.data="mean_cl_normal", geom = "line", mapping = aes(group = 1))(未经测试)的内容怎么样? -
结果为@987654325@