如何在 Python 中限制循环的迭代次数?
for index, item in enumerate(items):
print(item)
if index == limit:
break
有没有更短的、惯用的方式来写上面的内容?怎么样?
包括索引
zip 在其参数中最短的可迭代对象处停止。 (与 zip_longest 的行为相反,它使用最长的可迭代对象。)
range 可以提供一个有限的迭代器,我们可以将它与我们的主迭代器一起传递给 zip。
所以我们可以将range 对象(带有stop 参数)传递给zip,并像有限枚举一样使用它。
zip(range(limit), items)
使用 Python 3,zip 和 range 返回 iterables,它将数据流水线化,而不是将数据具体化为中间步骤的列表。
for index, item in zip(range(limit), items):
print(index, item)
要在 Python 2 中获得相同的行为,只需将 xrange 替换为 range 并将 itertools.izip 替换为 zip。
from itertools import izip
for index, item in izip(xrange(limit), items):
print(item)
如果不需要索引,itertools.islice
你可以使用itertools.islice:
for item in itertools.islice(items, 0, stop):
print(item)
不需要分配给索引。
组合enumerate(islice(items, stop))获取索引
正如 Pablo Ruiz Ruiz 指出的那样,我们也可以用 enumerate 组成 islice。
for index, item in enumerate(islice(items, limit)):
print(index, item)
为什么enumerate 没有内置这个功能?
这里是用纯 Python 实现的枚举(可能会进行修改以在 cmets 中获得所需的行为):
def enumerate(collection, start=0): # could add stop=None
i = start
it = iter(collection)
while 1: # could modify to `while i != stop:`
yield (i, next(it))
i += 1
对于那些已经使用 enumerate 的人来说,上面的性能会降低,因为它必须检查是否是时候停止每次迭代。如果没有停止参数,我们可以检查并使用旧的枚举:
_enumerate = enumerate
def enumerate(collection, start=0, stop=None):
if stop is not None:
return zip(range(start, stop), collection)
return _enumerate(collection, start)
这个额外的检查对性能的影响可以忽略不计。
至于为什么 enumerate 没有停止参数,这是最初提出的(见PEP 279):
这个函数最初是用可选的 start 提出的
并停止争论。 GvR [Guido van Rossum] 指出函数调用
enumerate(seqn, 4, 6) 有一个替代的、合理的解释为
将返回第四个和第五个元素的切片
顺序。为了避免歧义,可选参数是
即使这意味着失去作为循环计数器的灵活性,也会下降。
这种灵活性对于常见的
从一开始计数,如:
for linenum, line in enumerate(source,1): print linenum, line
显然start 被保留是因为它非常有价值,而stop 被删除是因为它的用例较少并导致新功能的使用混乱。
避免使用下标符号进行切片
另一个答案说:
为什么不简单地使用
for item in items[:limit]: # or limit+1, depends
这里有一些缺点:
- 它仅适用于接受切片的迭代,因此受到更多限制。
- 如果他们确实接受切片,它通常会在内存中创建一个新的数据结构,而不是迭代引用数据结构,因此它会浪费内存(所有内置对象在切片时都会创建副本,但是,例如,numpy 数组会创建一个切片时查看)。
- 不可分割的迭代将需要其他类型的处理。如果您切换到惰性评估模型,您还必须使用切片更改代码。
只有在了解限制以及是否生成副本或视图时,才应使用带下标表示法的切片。
结论
我假设现在 Python 社区知道 enumerate 的用法,混淆成本会被参数的价值所抵消。
在那之前,您可以使用:
for index, element in zip(range(limit), items):
...
或
for index, item in enumerate(islice(items, limit)):
...
或者,如果您根本不需要索引:
for element in islice(items, 0, limit):
...
并避免使用下标符号进行切片,除非您了解这些限制。