【发布时间】:2020-05-20 12:19:17
【问题描述】:
我有二进制数据,具体取决于个人是否通过/未通过测试,以及 df(data) 中的特征信息(例如性别)和他们所属的部门(例如 x、y、z)
head(data,9)
department gender pass
x Male 1
y Female 1
y Male 0
y Male 1
x Female 1
z Female 0
z Male 1
x Male 0
z Female 0
我可以轻松地对性别和传递之间的关系进行卡方检验:
chisq.test(data$gender, data$pass)
但是有没有一种方法可以为“部门”(x,y,z) 中的值单独运行,而不必每次都手动对数据进行子集化?
我可以创建一个新的数据框,使用 tapply 分解每个部门的整体通过率:
as.data.frame(tapply(data$pass, data$department,mean))
但是有没有办法我可以添加一个新变量来指示上述测试的结果(比如说 p 值)?
【问题讨论】:
标签: r for-loop chi-squared