【发布时间】:2017-07-19 14:22:40
【问题描述】:
我希望从看起来像这样的东西重塑一个数据框,带有变量:
Year, University, Degree, Gender
每行描述一个学生的条目,例如:
2017, University College London, Social Science, Male
2017, University of Leeds, Social science, Non-Binary
我想根据这些数据创建一个频率表,以压缩行数,这样对于每所大学,每个学位类别都有 19 行,然后对于每个学位,计算/频率显示了每个性别,看起来像这样。
Year University Degree [Gender (Male, Female, Non-Binary)]
2017 UCL Biological Sciences 1 0 2
我希望这是有道理的。谢谢你的帮助。
编辑: 我现在希望能够使用数据的子集将此数据绘制为折线图。我目前在绘图功能之外进行子集化,就像这样
subsetucl <- TFtab[which(TFtab$University == 'University College London'),]
ggplot(data=subsetucl, aes(x=Year, y=Female, group=Degree, color = Degree)) + geom_line()+ geom_point(size = 0.8) + xlab("Year of application") + ylab("Frequnecy of Females") + ggtitle("UCL Applications by Degree (2011-2017)") + theme_bw()
在绘图函数中对数据进行子集化的最佳方法是什么,以及如何最好地显示所有性别的线条,而不仅仅是女性频率。 谢谢你
【问题讨论】: