【发布时间】:2021-09-10 06:50:27
【问题描述】:
我有一个数据库,其中有来自 75 所学校的 30000 名学生的 30000 次观察,每所学校都由自己的代码定义,例如,您在下面看到由代码“01302P”定义的同一所学校的 5 名学生的分数”。
但是,还有许多其他学校(总共 75 所),并且对于每所学校,我们都有一个特定的代码,
然后,我们计算每所学校所有学生的平均分数,这意味着我们有一个包含每所学校 75 个平均分数的表格,这个平均分数可以让我们比较每所学校的表现。
现在我要做的是根据学校的平均分数来订购学校,我尝试了以下代码:
boxplot(moy_exam2~CODEETAB,epl_data,las=2,main="schools order",xlab = NULL,ylab = "Mean of score (moy_exam2)",col = 'red')
它生成了这个箱线图,我可以根据学生的平均分数来判断哪所学校是最好的,它的代码是“51680Y”,但我不能做更多的事情!因为剧情里满是学校,看不清楚顺序。
但我需要一种方法来根据平均分数结果对所有学校进行排序,
另外我更喜欢使用 ggplot2 库来增强代码
【问题讨论】: