【发布时间】:2021-05-29 08:03:42
【问题描述】:
我正在尝试找到一种方法来灵活地更改我在 pandas 数据框中为每个组分箱的行数。
每个组 ID 有 ~700 行,我想添加一个名为 bin_number 的列,以便从 0 开始它重复 0 以达到我想要的 bin 长度,然后 bin_number 将是 1并重复n次等等。
所以,假设我想要 10 个中的 bin_length,我将有 70 个 bin,并且 bin 编号将从 0 到 69 重复 10 次,从每个 ID 组重新开始。该列将如下所示:
0
0
0 (repeating bin_length number of times)
.
.
1
1
1
如果它可以灵活地适应每组中不同的行数,那就更好了。
这是我一直在使用的方法,但它似乎不是正确的方法。
df.groupby("ID").apply(lambda x: np.arange(len(df)) // 10)
任何指针表示赞赏!谢谢!
【问题讨论】:
标签: python pandas pandas-groupby