【发布时间】:2012-12-20 00:30:36
【问题描述】:
我有两个具有相同形状 (105,234) 的二维数组,名为 A 和 B,基本上由其他数组的平均值组成。我熟悉 Python 的 scipy 包,但我似乎无法找到一种方法来测试两个数组在每个单独的数组索引处是否在统计上显着不同。我认为这只是一个大型的 2D 配对 T 检验,但我遇到了困难。有什么想法或其他要使用的软件包吗?
【问题讨论】:
-
“每个单独的数组索引”是指每一行是否不同?另外,您能否提供一个可重现的示例来说明您正在使用的数据类型?
-
要进行 T 检验,您将需要计算均值的总体方差。你打算如何获得这些?或者,请提供一个原始数据示例以及您如何处理这些数据,然后再提出问题,我们或许可以为您指明正确的方向。
-
不,我实际上需要针对不同阵列中的另一个网格点测试每个单独的网格点。
-
所以,本质上是两个非常大的二维数组。在每个单独的位置测试它们在统计上是否存在显着差异。
-
与 Matlab 的
ttest2等效的 SciPy 函数是scipy.stats.ttest_ind。但是他们都没有检查数组是否“在每个单独的数组索引处有统计学上的显着差异”。他们所做的是将数组列与列进行比较(对于 Matlab,默认 SciPy 中的行)。如果您不了解仅通过两种方式无法计算出统计显着性,我建议使用random模块来生成您的测试结果:至少您不会有确定性的错觉......跨度>
标签: python arrays numpy statistics scipy