【发布时间】:2021-05-06 20:31:19
【问题描述】:
所有(R 用户), 非常感谢您提前。我有一个数据集,其中包含来自多个州的学生分数。每个州都有不同的学校(本例中为 10 所学校),每所学校必须是“公立”或“私立”;和三个项目的考试成绩。我需要计算每个项目的每个学校的平均值,并显示学校的类型,然后将结果保存到 excel 文件中以导出它们。
excel文件的预期结果将包括:
- 州名列,
- 学校名称列(每个州列 10 所学校),
- 学校类型列(表示“公立”或“私立”),
- 每所学校的学生人数,
- item1 的平均值,
- item2 的平均值,并且
- item3 的平均值。
library(randomNames)
# example to demonstrate the general concept):
ID = 1:50
states = rep(c("TS", "NE", "AR", "MO", "WA"),times = c(10, 10, 10, 10, 10))
schools = randomNames::randomNames(50) ## 5 first last names separated by a space
type = rep(c("private", "public"),times = c(20,30))
item1 = rnorm(50, mean=25, sd=5)
item2 = rnorm(50, mean=30, sd=5)
item3 = rnorm(50, mean=15, sd=5)
df = data.frame(ID, states, schools, type, item1, item2, item3)
然后我需要将它保存到excel文件中以使用以下代码分别导出每个状态:
# this below code works fine, I'm just adding it to explain the full concept.
list_data <- split(df, df$states)
Map(openxlsx::write.xlsx, list_data, paste0(names(list_data), '.xlsx'))
非常感谢。
【问题讨论】:
标签: r data-analysis