【问题标题】:Difference in means test on pandas's summary statistics?pandas汇总统计的均值测试差异?
【发布时间】:2020-03-02 20:14:19
【问题描述】:

我希望对两个 DataFrame 的汇总统计数据进行均值测试。

df1[['sd']].describe()
                sd
count  5000.000000
mean      0.635558
std       0.086109
min       0.492922
25%       0.577885
50%       0.639906
75%       0.688645
max       0.800767

df2[['sd']].describe()
                sd
count  5000.000000
mean      0.640954
std       0.084459
min       0.496823
25%       0.577373
50%       0.644122
75%       0.693863
max       0.798076

我正在寻找一些可以调用这些汇总统计数据的函数,以告诉我我的均值差异是否具有统计显着性。

【问题讨论】:

    标签: python pandas numpy statistical-test


    【解决方案1】:

    如果您观察到来自相同或不同总体的两个独立样本,则对独立样本执行 t 检验。

    这是对两个独立样本具有相等平均值的原假设的双边检验。

    from scipy.stats import ttest_ind
    
    ttest_ind(df1['sd'], df2['sd'])
    
    

    输出将是 t 统计量和 p 值。

    【讨论】:

      猜你喜欢
      • 2018-07-14
      • 1970-01-01
      • 2019-08-18
      • 2023-01-19
      • 1970-01-01
      • 2020-04-26
      • 2016-10-04
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多