如何在 Python 中高效地执行数百万个 t 检验？答案

【问题标题】：How do you efficiently perform millions of t-tests in Python?如何在 Python 中高效地执行数百万个 t 检验？
【发布时间】：2020-07-05 03:39:12
【问题描述】：

长话短说，我需要进行数亿次 t 检验。我有两个样本列表，ys 和ns，我想比较每个列表中的一个样本，所以ys 中的第一个样本将与ns 中的第一个样本进行比较，依此类推。结果将是一个 p 值列表，每个比较都有一个。最快的方法是什么？目前，我正在使用map 函数

p_values = [result[1] for result in list(map(ttest_ind, ys, ns))]

但它仍然很慢。 numpy.vectorize 看起来可能更快，但我不知道如何将它与以两个列表作为输入的函数一起使用。如果我硬编码 t 检验数学而不是使用 scipy.stats.ttest_ind，会更快吗？

【问题讨论】：

【解决方案1】：

整个想法是：不在 Python 中运行，而是在 C/C++ 中运行。

您有两种选择：

【讨论】：