【发布时间】:2020-07-23 05:39:59
【问题描述】:
我有一个看起来像这样的 DataFrame:
Name Count
0 John 0.25
1 Adam 0.75
2 Michael 1.5
3 Jane 0.8
4 Anna 2.0
5 Sarah 0.25
我的目标是根据限制值将此 DataFrame 拆分为多个 DataFrame。 对于此示例,限制值为 3 - 因此结果如下所示:
Name Count
0 John 0.25
1 Adam 0.75
2 Michael 1.5
Name Count
0 Jane 0.8
1 Anna 2.0
Name Count
0 Sarah 0.25
关键是在每个新的 DataFrame 中,计数的总和接近极限值,但没有超过它(即 Jane 在第二个 DataFrame 中,因为如果她包含在第一个 DataFrame 中,总和将为3.3,超过了3)的极限值。
我相信 .iterrows 可以做到这一点,但这相当重/慢,所以寻找另一种解决方案。
【问题讨论】:
-
你能发布一个可重现的例子,这样使用起来会更容易吗?
-
你可以使用
pd.read_clipboard()@UGuntupalli