while 循环比 for 循环快 1000 倍？答案

【问题标题】：While loop >1000 times faster than for loop?while 循环比 for 循环快 1000 倍？
【发布时间】：2017-11-29 07:15:40
【问题描述】：

因此，关于 for 循环与 while 循环的速度的问题之前已经被问过很多次了。 for 循环应该更快。
但是，当我在 Python 3.5.1 中对其进行测试时，结果如下：

timeit.timeit('for i in range(10000): True', number=10000)
>>> 12.697646026868842
timeit.timeit('while i<10000: True; i+=1',setup='i=0', number=10000)
>>> 0.0032265179766799434

while 循环的运行速度比 for 循环快 3000 倍！我还尝试为 for 循环预先生成一个列表：

timeit.timeit('for i in lis: True',setup='lis = [x for x in range(10000)]', number=10000)
>>> 3.638794646750142
timeit.timeit('while i<10000: True; i+=1',setup='i=0', number=10000)
>>> 0.0032454974941904524

这使 for 循环快了 3 倍，但差异仍然是 3 个数量级。

为什么会这样？

【问题讨论】：

我不太明白你得到的时差大小；创建一个range() 对象是有代价的，只是没有那么大的代价。即使在 Python 2 上，我也无法让它一直运行到 12.7 秒。
啊，我的笔记本电脑的速度只有 6 倍，仅此而已。
你在运行什么python？这是一个差异更大的调试版本吗？
@Alex Python 3.5.1。我的笔记本电脑很慢，所以我预计绝对时间会很大。但是你得到了截然不同的相对差异吗？
我的笔记本电脑几乎和 Martijn 一样。

标签： python performance python-3.x loops

【解决方案1】：

您正在创建 10k range() 对象。这些需要一些时间才能实现。然后，您还必须为这 10k 个对象创建 iterator objects（以便 for 循环遍历这些值）。接下来，for 循环通过在生成的迭代器上调用 __next__ method 来使用迭代器协议。后两个步骤也适用于列表上的for 循环。

但最重要的是，您在while 循环测试中作弊。 while 循环只需要运行一次一次，因为您永远不会将i 重置回0（感谢Jim Fasarakis Hilliard pointing that out）。您实际上是在运行while 循环，总共进行了 19999 次比较；第一个测试运行 10k 次比较，其余 9999 次测试运行一次比较。而且这种比较很快：

>>> import timeit
>>> timeit.timeit('while i<10000: True; i+=1',setup='i=0', number=10000)
0.0008302750065922737
>>> (
...     timeit.timeit('while i<10000: True; i+=1', setup='i=0', number=1) +
...     timeit.timeit('10000 < 10000', number=9999)
... )
0.0008467709994874895

看看这些数字有多接近？

我的机器有点快，所以让我们创建一个基线进行比较；这是在 OS X 10.12.5 上运行的 Macbook Pro（Retina，15 英寸，2015 年中）上使用 3.6.1。并且让我们还修复while 循环以在测试中设置i = 0，而不是设置（只运行一次）：

>>> import timeit
>>> timeit.timeit('for i in range(10000): pass', number=10000)
1.9789885189966299
>>> timeit.timeit('i=0\nwhile i<10000: True; i+=1', number=10000)
5.172155902953818

糟糕，所以正确运行的while 实际上慢在这里，这是你的前提（和我的！）。

我使用pass 来避免回答有关引用该对象有多快的问题（它很快，但除此之外）。我的时间将比你的机器快 6 倍。

如果您想探索为什么迭代更快，您可以在 Python 中为 for 循环的各个组件计时，从创建 range() 对象开始：

>>> timeit.timeit('range(10000)', number=10000)
0.0036197409499436617

因此，创建 10000 个 range() 对象比运行一个迭代 10k 次的 while 循环需要更多时间。 range() 对象的创建成本高于整数。

这确实涉及全局名称查找，速度较慢，您可以使用setup='_range = range' 使其更快，然后使用_range(1000)；这减少了大约 1/3 的时间。

接下来，为此创建一个迭代器；这里我将为iter() function 使用本地名称，因为for 循环不必进行哈希表查找，而只需使用C 函数即可。当然，对二进制内存位置的硬编码引用要快得多：

>>> timeit.timeit('_iter(r)', setup='_iter = iter; r = range(10000)', number=10000)
0.0009729859884828329

相当快，但是；它与您的单个 while 循环迭代 10k 次所花费的时间相同。所以创建可迭代对象很便宜。 C 实现仍然更快。我们还没有迭代。

最后，我们在迭代器对象上调用__next__ 10k 次。这再次在 C 代码中完成，缓存了对内部 C 实现的引用，但是使用 functools.partial() object 我们至少可以尝试得到一个大致的数字：

>>> timeit.timeit('n()', setup='from functools import partial; i = iter(range(10000)); n = partial(i.__next__)', number=10000) * 10000
7.759470026940107

男孩，对 iter(range(1000)).__next__ 的 10k 次 10k 次调用所花费的时间几乎是 for 循环管理的 4 倍；这表明实际的 C 实现是多么高效。

但是，它确实说明了 C 代码中的循环要快得多，这就是为什么 while 循环在正确执行时实际上更慢的原因；在字节码中对整数求和并进行布尔比较比在 C 代码中迭代 range() 需要更多的时间（CPU 直接在 CPU 寄存器中进行递增和比较）：

>>> (
...     timeit.timeit('9999 + 1', number=10000 ** 2) +
...     timeit.timeit('9999 < 10000', number=10000 ** 2)
... )    
3.695550534990616

正是这些操作使while 循环慢了大约 3 秒。

TLDR：您实际上没有正确测试while 循环。我也应该早点注意到这一点。

【讨论】：

【解决方案2】：

您的时间安排不正确，setup 只执行一次，然后对于 所有后续运行，i 的值是 10000。请参阅timeit 上的文档：

主语句的执行次数。这会执行一次setup 语句，然后返回执行多次主语句所需的时间，以浮点数形式测量，以秒为单位。

通过为每次重复打印 i 来额外验证它：

>>> timeit('print(i)\nwhile i<10000: True; i+=1',setup='i=0', number=5)
0
10000
10000
10000
10000

因此，所有后续运行仅执行比较（即True）并提前完成。

正确计时，看看for 循环实际上如何更快：

>>> timeit('i=0\nwhile i<10000: True; i+=1', number=10000)
8.416439056396484
>>> timeit('for i in range(10000): True', number=10000)
5.589155912399292

【讨论】：