【发布时间】:2019-01-18 11:58:18
【问题描述】:
我有一个 df 形式的数据框
class_1_frequency class_2_frequency
group_1 20 10
group_2 60 25
..
group_n 50 15
假设 class_1 共有 70 个成员,class_2 有 30 个。
对于每一行(group_1、group_2、..group_n),我想创建列联表(最好是动态的),然后执行chisquare test 来评估 p 值。
例如,对于 group_1,引擎盖下的列联表如下所示:
class_1 class_2
group_1_present 20 10
group_1_absent 70-20 30-10
另外,我知道scipy.stats.chi2_contingency() 是适合卡方的函数,但我无法将它应用到我的上下文中。我看过之前讨论过的问题,例如:here 和 here。
实现这一目标的最有效方法是什么?
【问题讨论】:
标签: python pandas numpy scipy statistics