【发布时间】:2013-12-05 00:03:47
【问题描述】:
我有一个基本上是不平衡面板的 pandas 数据框。我想要做的是,对于每个组,在满足条件后放弃所有观察。所以给定这个数据集:
person period hasTattoo
A 1 N
A 2 Y
A 3 Y
A 4 Y
B 1 N
B 2 N
C 1 Y
C 2 Y
我想得到这个:
person period hasTattoo
A 1 N
A 2 Y
B 1 N
B 2 N
C 1 Y
我只包括条件不满足的时期,以及满足条件的时期,之后什么都没有。在 R 中,我可以只使用 data.table。
dat[, subCount := 1:.N, by = c("person", "hasTattoo")]
dat <- dat[!(hasTattoo=="Y" & subCount > 1),]
【问题讨论】: