【问题标题】:While loop >1000 times faster than for loop?while 循环比 for 循环快 1000 倍?
【发布时间】:2017-11-29 07:15:40
【问题描述】:

因此,关于 for 循环与 while 循环的速度的问题之前已经被问过很多次了。 for 循环应该更快。
但是,当我在 Python 3.5.1 中对其进行测试时,结果如下:

timeit.timeit('for i in range(10000): True', number=10000)
>>> 12.697646026868842
timeit.timeit('while i<10000: True; i+=1',setup='i=0', number=10000)
>>> 0.0032265179766799434

while 循环的运行速度比 for 循环快 3000 倍!我还尝试为 for 循环预先生成一个列表:

timeit.timeit('for i in lis: True',setup='lis = [x for x in range(10000)]', number=10000)
>>> 3.638794646750142
timeit.timeit('while i<10000: True; i+=1',setup='i=0', number=10000)
>>> 0.0032454974941904524

这使 for 循环快了 3 倍,但差异仍然是 3 个数量级。

为什么会这样?

【问题讨论】:

  • 我不太明白你得到的时差大小;创建一个range() 对象是有代价的,只是没有那么大的代价。即使在 Python 2 上,我也无法让它一直运行到 12.7 秒。
  • 啊,我的笔记本电脑的速度只有 6 倍,仅此而已。
  • 你在运行什么python?这是一个差异更大的调试版本吗?
  • @Alex Python 3.5.1。我的笔记本电脑很慢,所以我预计绝对时间会很大。但是你得到了截然不同的相对差异吗?
  • 我的笔记本电脑几乎和 Martijn 一样。

标签: python performance python-3.x loops


【解决方案1】:

您正在创建 10k range() 对象。这些需要一些时间才能实现。然后,您还必须为这 10k 个对象创建 iterator objects(以便 for 循环遍历这些值)。接下来,for 循环通过在生成的迭代器上调用 __next__ method 来使用迭代器协议。后两个步骤也适用于列表上的for 循环。

但最重要的是,您在while 循环测试中作弊while 循环只需要运行一次一次,因为您永远不会将i 重置回0(感谢Jim Fasarakis Hilliard pointing that out)。您实际上是在运行while 循环,总共进行了 19999 次比较;第一个测试运行 10k 次比较,其余 9999 次测试运行一次比较。而且这种比较很快:

>>> import timeit
>>> timeit.timeit('while i<10000: True; i+=1',setup='i=0', number=10000)
0.0008302750065922737
>>> (
...     timeit.timeit('while i<10000: True; i+=1', setup='i=0', number=1) +
...     timeit.timeit('10000 < 10000', number=9999)
... )
0.0008467709994874895

看看这些数字有多接近?

我的机器有点快,所以让我们创建一个基线进行比较;这是在 OS X 10.12.5 上运行的 Macbook Pro(Retina,15 英寸,2015 年中)上使用 3.6.1。并且让我们还修复while 循环以在测试中设置i = 0,而不是设置(只运行一次):

>>> import timeit
>>> timeit.timeit('for i in range(10000): pass', number=10000)
1.9789885189966299
>>> timeit.timeit('i=0\nwhile i<10000: True; i+=1', number=10000)
5.172155902953818

糟糕,所以正确运行的while 实际上在这里,这是你的前提(和我的!)。

我使用pass 来避免回答有关引用该对象有多快的问题(它很快,但除此之外)。我的时间将比你的机器快 6 倍。

如果您想探索为什么迭代更快,您可以在 Python 中为 for 循环的各个组件计时,从创建 range() 对象开始:

>>> timeit.timeit('range(10000)', number=10000)
0.0036197409499436617

因此,创建 10000 个 range() 对象比运行一个迭代 10k 次的 while 循环需要更多时间。 range() 对象的创建成本高于整数。

这确实涉及全局名称查找,速度较慢,您可以使用setup='_range = range' 使其更快,然后使用_range(1000);这减少了大约 1/3 的时间。

接下来,为此创建一个迭代器;这里我将为iter() function 使用本地名称,因为for 循环不必进行哈希表查找,而只需使用C 函数即可。当然,对二进制内存位置的硬编码引用要快得多:

>>> timeit.timeit('_iter(r)', setup='_iter = iter; r = range(10000)', number=10000)
0.0009729859884828329

相当快,但是;它与您的单个 while 循环迭代 10k 次所花费的时间相同。所以创建可迭代对象很便宜。 C 实现仍然更快。我们还没有迭代。

最后,我们在迭代器对象上调用__next__ 10k 次。这再次在 C 代码中完成,缓存了对内部 C 实现的引用,但是使用 functools.partial() object 我们至少可以尝试得到一个大致的数字:

>>> timeit.timeit('n()', setup='from functools import partial; i = iter(range(10000)); n = partial(i.__next__)', number=10000) * 10000
7.759470026940107

男孩,对 iter(range(1000)).__next__ 的 10k 次 10k 次调用所花费的时间几乎是 for 循环管理的 4 倍;这表明实际的 C 实现是多么高效。

但是,它确实说明了 C 代码中的循环要快得多,这就是为什么 while 循环在正确执行时实际上更慢的原因;在字节码中对整数求和并进行布尔比较比在 C 代码中迭代 range() 需要更多的时间(CPU 直接在 CPU 寄存器中进行递增和比较):

>>> (
...     timeit.timeit('9999 + 1', number=10000 ** 2) +
...     timeit.timeit('9999 < 10000', number=10000 ** 2)
... )    
3.695550534990616

正是这些操作使while 循环慢了大约 3 秒。


TLDR:您实际上没有正确测试while 循环。我也应该早点注意到这一点。

【讨论】:

    【解决方案2】:

    您的时间安排不正确,setup 只执行一次,然后对于 所有后续运行i 的值是 10000。请参阅timeit 上的文档:

    主语句的执行次数。这会执行一次setup 语句,然后返回执行多次主语句所需的时间,以浮点数形式测量,以秒为单位。

    通过为每次重复打印 i 来额外验证它:

    >>> timeit('print(i)\nwhile i<10000: True; i+=1',setup='i=0', number=5)
    0
    10000
    10000
    10000
    10000
    

    因此,所有后续运行仅执行比较(即True)并提前完成。

    正确计时,看看for 循环实际上如何更快:

    >>> timeit('i=0\nwhile i<10000: True; i+=1', number=10000)
    8.416439056396484
    >>> timeit('for i in range(10000): True', number=10000)
    5.589155912399292
    

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 2011-01-29
      • 2018-06-06
      • 2016-04-15
      • 2013-06-28
      • 1970-01-01
      • 2021-11-25
      • 2012-12-02
      • 2019-11-10
      相关资源
      最近更新 更多