【发布时间】:2021-02-13 15:01:54
【问题描述】:
你好我所有的数据框看起来像
category calss test1 test2
1 Yes 5.5 4.2
1 No 5.8 4.3
1 Yes 6.6 3.2
2 Yes 6 7.7
2 No 5.7 5.8
3 No 9.7 4.5
3 Yes 6.8 8.5
2 No 6.3 9.6
3 Yes 8.5 2.6
我想分别根据类和类别计算(test1 和 test2 之间)的平均 SD 和 Pvalue
我使用 dplyr 来计算均值和 SD,并努力计算 Pvalue,因为我的数据集包含 1000 行和 4 个不同的类别和 8 个类
这是我在使用 dplyr 获得 mean 和 sd 后得到的结果
category class test1_Mean test1_SD test2_Mean test2_SD
1 Yes 6 1 3.7 1.1
1 No 5.8 0 4.3 0
2 Yes 9.6 0 4.4 0
2 No 6 1.1 7.7 1
3 Yes 7.6 0.5 5.5 0.8
3 No 9.7 0 4.5 0
而 SD 只是手动输入以显示我想要的输出的错误值
category class test1_Mean test1_SD test2_Mean test2_SD Pvalue
1 Yes 6 1 3.7 1.1 0.05
1 No 5.8 0 4.3 0 0.14
2 Yes 9.6 0 4.4 0 0.69
2 No 6 1.1 7.7 1 0.001
3 Yes 7.6 0.5 5.5 0.8 2.00E+05
3 No 9.7 0 4.5 0 0.04
提前致谢
【问题讨论】:
-
不确定您所说的 Pvalue 是什么意思,您是否正在执行任何统计检验,例如两个样本 T 检验?
-
是的,我的研究的配对 t 检验