【问题标题】:test for difference of means returns wrong result测试均值差异返回错误结果
【发布时间】:2020-04-26 04:13:40
【问题描述】:

我正在运行 R-intro 手册的示例:

A = c(79.98, 80.04, 80.02, 80.04, 80.03, 80.03, 80.04, 79.97, 80.05, 80.03, 80.02, 80.00, 80.02)
B = c(80.02, 79.94, 79.98, 79.97, 79.97, 80.03, 79.95, 79.97)
t.test(A, B)

这会产生以下结果:

Welch Two Sample t-test

data:  A and B
t = 3.2499, df = 12.027, p-value = 0.006939
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
 0.01385526 0.07018320
sample estimates:
mean of x mean of y 
 80.02077  79.97875 

问题是:如果均值的差异包含在置信区间内(80.02077-79.97875=0.04202 和 0.01385526

【问题讨论】:

  • 您正在测试的差异不为零。置信区间是样本均值之差的 95% 置信区间。粗略地说,如果 0 不在 CI 中,你会得到 p-value
  • 也没有任何结论。你是要得出结论的人。它只是说明了替代假设是什么

标签: r statistics t-test


【解决方案1】:

我认为这是一个语言/解释问题。你在翻译

另一种假设:均值的真实差异不等于 0

作为

备择假设为真。均值之差不等于0

而不是(按预期)

备择假设是:“均值的真实差值不等于 0”

(根据严格的常客逻辑,我们永远不会得出结论“备择假设为真”,只有我们可以拒绝原假设。)

为了评估测试的结论,您应该查看 95% 置信区间 (0.01385526, 0.07018320) 和/或 p 值 (0.0069)。 R 中实现的过程遵循“Neyman-Pearson”风格,您预先指定一个 alpha 水平并将结果分为“拒绝零假设”或“无法拒绝零假设”。如果你想这样做,你可以只看 p 值,或者,如果你想让 R 为你做这件事,

alpha <- 0.05  ## or whatever your preferred cutoff is
t_result <- t.test(A,B)
t_result$p.value<alpha ## TRUE (reject null hypothesis)

此外,您对置信区间的解释是错误的。您应该查看置信区间是否包括零;它将始终以观察到的差异为中心(因此观察到的差异将始终包含在 95% CI 中)。

【讨论】:

    猜你喜欢
    • 2015-10-03
    • 2021-06-09
    • 1970-01-01
    • 2022-01-06
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2019-08-08
    相关资源
    最近更新 更多