【发布时间】:2017-11-30 08:29:36
【问题描述】:
我有一个数据框,其中包含来自两组不同样本的值。我对这些执行了 scipy.stats.ttest ,效果很好,但我有点担心这么多测试可能会产生多个测试错误。
我想知道如何用这个实现 MTC(多重测试校正)。我的意思是,scipy 或 statsmodels 中是否有一些函数可以直接执行测试并将 MTC 应用于 p 值的输出系列,或者我可以在 p 值列表上应用 MTC 函数而没有问题?
我知道 statsmodels 可能包含这样的功能,但是它的强大之处在于,它在可管理性和文档方面非常缺乏,不幸的是(实际上,这不是开发人员的错,对于如此庞大的项目,他们是三个人)。无论如何,我有点卡在这里,所以我很乐意接受任何建议。我在 CrossValidated 中没有问这个,因为它与实现部分的关系比统计部分更重要。
【问题讨论】:
-
statsmodels 具有标准的多重测试 p 值校正,以及用于所有成对比较的 tukey-hsd。 statsmodels.org/dev/…
-
你的样本和组有什么关系?这些是独立的比较。多次检验的 p 值校正始终适用,但对于特定比较,存在比“通用”p 值校正具有更高功效的检验。
标签: python pandas numpy scipy statsmodels