【问题标题】:meaning V value, wilcoxen signed rank test意义 V 值,wilcoxon 符号秩检验
【发布时间】:2020-11-14 07:28:59
【问题描述】:

我对 Wilcoxon 符号等级测试的结果有疑问:

我的数据包含使用治疗的 2 组(成对)试验。结果以%计分。团体由 131 人组成。

当我在 R 中运行测试时,我得到了以下结果:

wilcox.test(no.treatment, with.treatment, paired=T) 
# Wilcoxon signed rank test with continuity correction 
# data:  no.treatment and with.treatment V = 3832, p-value = 0.7958
# alternative hypothesis: true location shift is not equal to 0

我想知道V 值是什么意思。我在某处读到它与正分数的数量有关(?),但我想知道它是否可以告诉我有关数据和解释的任何信息?

【问题讨论】:

标签: statistics


【解决方案1】:

在回答你的问题之前,我会提供一些背景知识。

The Wilcoxon signed rank sum test 比较同一 N 人(此处为 131)之间的两个值,例如在两个时间点测量 131 人的血液值。测试的目的是查看血液值是否发生了变化。

您得到的V-statistic 没有直接的解释。该值基于两组中个体之间的成对差异。它是一个变量的值,应该遵循一定的概率分布。直观地说,你可以说V的值越大,你抽样的两组之间的差异就越大。

与假设检验一样,您(嗯,wilcox.test 函数)将计算该变量的值 (V) 等于或大于 3832 的概率 prob('observing a value of 3832 or larger, when the groups are actually the same')

如果两组之间确实没有差异,V 的值将“接近于零”。您看到的值 V 是否“接近于零”取决于概率分布。这个变量的概率分布并不简单,但幸运的是这并不重要,因为wilcoxon 知道分布并为您计算概率 (0.7958)。

总之

您的组没有显着差异,V 没有明确的解释。

【讨论】:

  • 非常感谢!真的有帮助:)
  • 文章中是否需要报V值?
【解决方案2】:

函数wilcox.test()产生的V统计可以在R中计算如下:

# Create random data between -0.5 and 0.5
da_ta <- runif(1e3, min=-0.5, max=0.5)
# Perform Wilcoxon test using function wilcox.test()
wilcox.test(da_ta)
# Calculate the V statistic produced by wilcox.test()
sum(rank(abs(da_ta))[da_ta > 0])

用户MrFlick在回答这个问题时提供了上述答案: How to get same results of Wilcoxon sign rank test in R and SAS.
Wilcoxon W 统计量与 V 统计量不同,可以在R 中计算如下:

# Calculate the Wilcoxon W statistic
sum(sign(da_ta) * rank(abs(da_ta)))

上述统计量可以与Wilcoxon概率分布进行比较,得到p值。 Wilcoxon 分布没有简单的公式,但可以使用 Monte Carlo 模拟来模拟。

【讨论】:

    【解决方案3】:

    V的值并不是正分的个数,而是这些正分的总和。 此外,该测试未提供对负分数总和的测量。以下示例中提供了用于计算正分数和负分数总和的简短脚本:

    a <- c(214, 159, 169, 202, 103, 119, 200, 109, 132, 142, 194, 104, 219, 119, 234)
    b <- c(159, 135, 141, 101, 102, 168, 62, 167, 174, 159, 66, 118, 181, 171, 112)
    
    diff <- c(a - b) #calculating the vector containing the differences
    diff <- diff[ diff!=0 ] #delete all differences equal to zero
    diff.rank <- rank(abs(diff)) #check the ranks of the differences, taken in absolute
    diff.rank.sign <- diff.rank * sign(diff) #check the sign to the ranks, recalling the signs of the values of the differences
    ranks.pos <- sum(diff.rank.sign[diff.rank.sign > 0]) #calculating the sum of ranks assigned to the differences as a positive, ie greater than zero
    ranks.neg <- -sum(diff.rank.sign[diff.rank.sign < 0]) #calculating the sum of ranks assigned to the differences as a negative, ie less than zero
    ranks.pos #it is the value V of the wilcoxon signed rank test
    [1] 80
    ranks.neg
    [1] 40
    

    学分:https://www.r-bloggers.com/wilcoxon-signed-rank-test/ (它们还为它提供了一个很好的上下文。)

    您还可以将这两个数字与它们的平均值(在本例中为 60)进行比较,这将是每一边的预期值,即正数总和为 60,负数总和为 60 表示两侧完全等价。正秩和 80 和负秩和 40 也可以被认为是等价的吗? (即,我们能否将这种“20”的差异归因于随机原因,或者这是否足以让我们拒绝无差异的假设?)

    因此,正如他们所解释的,这种情况的临界区间是 [25,95]。检查表上的 Wilcoxon 秩符号检验的临界值,此示例的临界值为 25(双尾检验中 5% 的 15 对;并且 120-25 = 95...)。这意味着区间 [40,80] 不够“大”,无法排除差异纯粹是由于随机抽样造成的可能性。 (始终如一地,p 值高于 alpha)。

    比较正分之和与负分之和有助于确定差异的显着性,从而丰富分析。此外,正等级本身是用于计算检验 p 值的输入,因此对它们的兴趣。

    但要从简单报告的正等级 (V) 总和中提取意义,我认为这并不简单。在提供信息方面,我认为至少也要检查负面排名的总和,以便对正在发生的事情有一个更一致的想法。 (当然,还有一般信息,例如样本量、p 值等)。

    【讨论】:

      【解决方案4】:

      我也对这个看似神秘的“V”统计数据感到困惑。我意识到这里已经有一些有用的答案,但是当我第一次阅读它们时,我并没有真正理解它们。所以在这里我以我终于理解的方式再次解释它。如果他们仍然感到困惑,希望它可以帮助其他人。

      V 统计量是分配给带有正号的差值的秩和。这意味着,当您运行 Wilcoxon 符号秩检验时,它会计算负秩和 (W-) 和正秩和 (W+)。检验统计量 (W) 通常是 (W-) 或 (W+) 的最小值,但 V-统计量只是 (W+)。

      要理解这一点的重要性,如果原假设为真,(W+) 和 (W-) 将是相似的。这是因为在给定样本数 (n) 的情况下,您的 (W+) 和 (W-) 将具有最大可能的组合值,即 (W+)+(W-)=n(n+1)/2。如果这个最大值被平均分配,那么配对样本集之间没有太大的差异,我们接受空值。如果 (W+) 和 (W-) 之间存在较大差异,则配对样本集之间存在较大差异,并且我们有替代假设的证据。差异程度及其显着性与W的临界值图有关。

      这里有一些特别有用的网站,可以检查概念是否仍然不是 100%:

      1.) https://mathcracker.com/wilcoxon-signed-ranks

      2.) https://sphweb.bumc.bu.edu/otlt/mph-modules/bs/bs704_nonparametric/BS704_Nonparametric6.html)

      3.) https://www.youtube.com/watch?v=TqCg2tb4wJ0

      TLDR;在 (W+) 是 (W+) 或 (W-) 中较小的情况下,R 报告的 V-statistic 与 W-statistic 相同。

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 2016-03-11
        • 2013-04-24
        • 2013-09-19
        • 1970-01-01
        • 2020-07-30
        • 1970-01-01
        • 1970-01-01
        • 2019-03-18
        相关资源
        最近更新 更多