【发布时间】:2010-09-21 13:28:56
【问题描述】:
给定所需的分区数量,分区的大小应该几乎相等。 This question 处理列表的问题。他们没有随机属性,但那是easily added。我的问题是,我有一个迭代器作为输入,所以 shuffle 不适用。原因是我想随机划分图的节点。该图可能非常大,因此我正在寻找一种不只是创建中间列表的解决方案。
我的第一个想法是使用带有随机数函数的compress() 作为选择器。但这仅适用于两个分区。
【问题讨论】:
-
"nearly equal in size" — 所以如果有 1000 个节点,我们想把它分成 5 个部分,是 197、195、206、201、201 可以接受还是必须是 200、200、 200、200、200?
-
@KennyTM:第一个是可以接受的。这用于k-fold交叉验证,所以有些偏差是可以接受的。
标签: python random iterator partitioning