如何为 scipy.stats 测试实现多重测试答案

【问题标题】：How to implement multiple testing for scipy.stats tests如何为 scipy.stats 测试实现多重测试
【发布时间】：2017-11-30 08:29:36
【问题描述】：

我有一个数据框，其中包含来自两组不同样本的值。我对这些执行了 scipy.stats.ttest ，效果很好，但我有点担心这么多测试可能会产生多个测试错误。

我想知道如何用这个实现 MTC（多重测试校正）。我的意思是，scipy 或 statsmodels 中是否有一些函数可以直接执行测试并将 MTC 应用于 p 值的输出系列，或者我可以在 p 值列表上应用 MTC 函数而没有问题？

我知道 statsmodels 可能包含这样的功能，但是它的强大之处在于，它在可管理性和文档方面非常缺乏，不幸的是（实际上，这不是开发人员的错，对于如此庞大的项目，他们是三个人）。无论如何，我有点卡在这里，所以我很乐意接受任何建议。我在 CrossValidated 中没有问这个，因为它与实现部分的关系比统计部分更重要。

【问题讨论】：

statsmodels 具有标准的多重测试 p 值校正，以及用于所有成对比较的 tukey-hsd。 statsmodels.org/dev/…
你的样本和组有什么关系？这些是独立的比较。多次检验的 p 值校正始终适用，但对于特定比较，存在比“通用”p 值校正具有更高功效的检验。

标签： python pandas numpy scipy statsmodels

【解决方案1】：

2019 年 10 月 9 日编辑：此链接从今天开始有效 https://www.statsmodels.org/stable/generated/statsmodels.stats.multitest.multipletests.html

原始答案（现在返回 404）

statsmodels.sandbox.stats.multicomp.multipletests 接受一个 p 值数组并返回调整后的 p 值。文档很清楚。

【讨论】：