【发布时间】:2019-02-03 09:40:45
【问题描述】:
要为 ML 任务正确准备数据,我需要能够将原始数据帧拆分为多个较小的数据帧。我想获取上面的所有行,包括“BOOL”列的值为1的行-每次出现1。即n个数据帧,其中n是1的出现次数。
数据样本:
df = pd.DataFrame({"USER_ID": ['001', '001', '001', '001', '001'],
'VALUE' : [1, 2, 3, 4, 5], "BOOL": [0, 1, 0, 1, 0]})
预期输出是 2 个数据帧,如图所示:
还有:
我考虑过使用 if-else 语句来追加行的 for 循环 - 但对于我正在使用的数据集来说,它的效率非常低。寻找一种更蟒蛇的方式来做到这一点。
【问题讨论】: