【问题标题】：meaning V value, wilcoxen signed rank test意义 V 值，wilcoxon 符号秩检验
【发布时间】：2020-11-14 07:28:59
【问题描述】：

我对 Wilcoxon 符号等级测试的结果有疑问：

我的数据包含使用治疗的 2 组（成对）试验。结果以%计分。团体由 131 人组成。

当我在 R 中运行测试时，我得到了以下结果：

wilcox.test(no.treatment, with.treatment, paired=T) 
# Wilcoxon signed rank test with continuity correction 
# data:  no.treatment and with.treatment V = 3832, p-value = 0.7958
# alternative hypothesis: true location shift is not equal to 0

我想知道V 值是什么意思。我在某处读到它与正分数的数量有关（？），但我想知道它是否可以告诉我有关数据和解释的任何信息？

【问题讨论】：

这个问题属于stats.stackexchange.com，因为它涉及一个与编程无关的统计问题

标签： statistics

【解决方案1】：

在回答你的问题之前，我会提供一些背景知识。

The Wilcoxon signed rank sum test 比较同一 N 人（此处为 131）之间的两个值，例如在两个时间点测量 131 人的血液值。测试的目的是查看血液值是否发生了变化。

您得到的V-statistic 没有直接的解释。该值基于两组中个体之间的成对差异。它是一个变量的值，应该遵循一定的概率分布。直观地说，你可以说V的值越大，你抽样的两组之间的差异就越大。

与假设检验一样，您（嗯，wilcox.test 函数）将计算该变量的值 (V) 等于或大于 3832 的概率 prob('observing a value of 3832 or larger, when the groups are actually the same')

如果两组之间确实没有差异，V 的值将“接近于零”。您看到的值 V 是否“接近于零”取决于概率分布。这个变量的概率分布并不简单，但幸运的是这并不重要，因为wilcoxon 知道分布并为您计算概率 (0.7958)。

总之

您的组没有显着差异，V 没有明确的解释。

【讨论】：

非常感谢！真的有帮助:)
文章中是否需要报V值？

【解决方案2】：

函数wilcox.test()产生的V统计可以在R中计算如下：

# Create random data between -0.5 and 0.5
da_ta <- runif(1e3, min=-0.5, max=0.5)
# Perform Wilcoxon test using function wilcox.test()
wilcox.test(da_ta)
# Calculate the V statistic produced by wilcox.test()
sum(rank(abs(da_ta))[da_ta > 0])

用户MrFlick在回答这个问题时提供了上述答案： How to get same results of Wilcoxon sign rank test in R and SAS.
Wilcoxon W 统计量与 V 统计量不同，可以在R 中计算如下：

# Calculate the Wilcoxon W statistic
sum(sign(da_ta) * rank(abs(da_ta)))

上述统计量可以与Wilcoxon概率分布进行比较，得到p值。 Wilcoxon 分布没有简单的公式，但可以使用 Monte Carlo 模拟来模拟。

【讨论】：

【解决方案3】：

V的值并不是正分的个数，而是这些正分的总和。此外，该测试未提供对负分数总和的测量。以下示例中提供了用于计算正分数和负分数总和的简短脚本：

a <- c(214, 159, 169, 202, 103, 119, 200, 109, 132, 142, 194, 104, 219, 119, 234)
b <- c(159, 135, 141, 101, 102, 168, 62, 167, 174, 159, 66, 118, 181, 171, 112)

diff <- c(a - b) #calculating the vector containing the differences
diff <- diff[ diff!=0 ] #delete all differences equal to zero
diff.rank <- rank(abs(diff)) #check the ranks of the differences, taken in absolute
diff.rank.sign <- diff.rank * sign(diff) #check the sign to the ranks, recalling the signs of the values of the differences
ranks.pos <- sum(diff.rank.sign[diff.rank.sign > 0]) #calculating the sum of ranks assigned to the differences as a positive, ie greater than zero
ranks.neg <- -sum(diff.rank.sign[diff.rank.sign < 0]) #calculating the sum of ranks assigned to the differences as a negative, ie less than zero
ranks.pos #it is the value V of the wilcoxon signed rank test
[1] 80
ranks.neg
[1] 40

学分：https://www.r-bloggers.com/wilcoxon-signed-rank-test/ （它们还为它提供了一个很好的上下文。）

您还可以将这两个数字与它们的平均值（在本例中为 60）进行比较，这将是每一边的预期值，即正数总和为 60，负数总和为 60 表示两侧完全等价。正秩和 80 和负秩和 40 也可以被认为是等价的吗？（即，我们能否将这种“20”的差异归因于随机原因，或者这是否足以让我们拒绝无差异的假设？）

因此，正如他们所解释的，这种情况的临界区间是 [25,95]。检查表上的 Wilcoxon 秩符号检验的临界值，此示例的临界值为 25（双尾检验中 5% 的 15 对；并且 120-25 = 95...）。这意味着区间 [40,80] 不够“大”，无法排除差异纯粹是由于随机抽样造成的可能性。（始终如一地，p 值高于 alpha）。

比较正分之和与负分之和有助于确定差异的显着性，从而丰富分析。此外，正等级本身是用于计算检验 p 值的输入，因此对它们的兴趣。

但要从简单报告的正等级 (V) 总和中提取意义，我认为这并不简单。在提供信息方面，我认为至少也要检查负面排名的总和，以便对正在发生的事情有一个更一致的想法。（当然，还有一般信息，例如样本量、p 值等）。

【讨论】：

【解决方案4】：

我也对这个看似神秘的“V”统计数据感到困惑。我意识到这里已经有一些有用的答案，但是当我第一次阅读它们时，我并没有真正理解它们。所以在这里我以我终于理解的方式再次解释它。如果他们仍然感到困惑，希望它可以帮助其他人。

V 统计量是分配给带有正号的差值的秩和。这意味着，当您运行 Wilcoxon 符号秩检验时，它会计算负秩和 (W-) 和正秩和 (W+)。检验统计量 (W) 通常是 (W-) 或 (W+) 的最小值，但 V-统计量只是 (W+)。

要理解这一点的重要性，如果原假设为真，(W+) 和 (W-) 将是相似的。这是因为在给定样本数 (n) 的情况下，您的 (W+) 和 (W-) 将具有最大可能的组合值，即 (W+)+(W-)=n(n+1)/2。如果这个最大值被平均分配，那么配对样本集之间没有太大的差异，我们接受空值。如果 (W+) 和 (W-) 之间存在较大差异，则配对样本集之间存在较大差异，并且我们有替代假设的证据。差异程度及其显着性与W的临界值图有关。

这里有一些特别有用的网站，可以检查概念是否仍然不是 100%：

1.) https://mathcracker.com/wilcoxon-signed-ranks

2.) https://sphweb.bumc.bu.edu/otlt/mph-modules/bs/bs704_nonparametric/BS704_Nonparametric6.html)

3.) https://www.youtube.com/watch?v=TqCg2tb4wJ0

TLDR;在 (W+) 是 (W+) 或 (W-) 中较小的情况下，R 报告的 V-statistic 与 W-statistic 相同。

【讨论】：