【发布时间】:2019-12-03 20:25:26
【问题描述】:
我有以下数据框示例:
child_id feature_1 feature_2 feature_3 feature_4 feature_5
10 1 0 0 0 0
10 0 0 1 0 0
10 0 1 0 0 0
10 0 0 0 1 0
20 0 0 0 0 1
20 1 0 0 0 0
20 0 1 1 0 0
20 0 0 0 0 0
但是,我想要这个堆叠的数据框,所以子 ID 不会重复多次:
child_id feature_1 feature_2 feature_3 feature_4 feature_5
10 1 1 1 1 0
20 1 1 1 0 1
由于每一行都不同,我不能简单地删除重复项。有任何想法吗?非常感谢!
【问题讨论】:
-
df.groupby('child_id').sum() -
^ 可以添加
.clip(upper=1),如果需要确保他们是假人或.any().astype(int)
标签: pandas dataframe stack pivot-table