【发布时间】:2021-11-04 17:47:16
【问题描述】:
在我在 PSM 上找到的示例中,数据集是不平衡的。换句话说,有一个小的治疗组和一个较大的对照组,从中得出最接近治疗组的观察值。通过这个过程,我们得到了一个数据集,对于治疗组和对照组具有相同数量的观察值。但是如果治疗组和对照组的观察值相等呢?
我有一个包含 600 个观察值的小型数据集; 300 治疗和 300 控制。我想提取两组治疗组和对照组的某些变量没有显着差异的观察结果。我该怎么做?
也就是说,我要限制:
1 - 我希望我的两组在某些变量方面在统计上不显着。
2- 我想在不违反 1 的情况下保留尽可能多的数据点。
我在R 中与MatchIt 合作过,但它似乎没有这样的选项。
【问题讨论】:
-
1应该更好地定义,例如是否应该只考虑边际分布,目标阈值是多少等。2与1不一致,因此应定义双重目标。 -
另一种方法怎么样,例如逆概率加权?
标签: python r propensity-score-matching