您正在创建 10k range() 对象。这些需要一些时间才能实现。然后,您还必须为这 10k 个对象创建 iterator objects(以便 for 循环遍历这些值)。接下来,for 循环通过在生成的迭代器上调用 __next__ method 来使用迭代器协议。后两个步骤也适用于列表上的for 循环。
但最重要的是,您在while 循环测试中作弊。 while 循环只需要运行一次一次,因为您永远不会将i 重置回0(感谢Jim Fasarakis Hilliard pointing that out)。您实际上是在运行while 循环,总共进行了 19999 次比较;第一个测试运行 10k 次比较,其余 9999 次测试运行一次比较。而且这种比较很快:
>>> import timeit
>>> timeit.timeit('while i<10000: True; i+=1',setup='i=0', number=10000)
0.0008302750065922737
>>> (
... timeit.timeit('while i<10000: True; i+=1', setup='i=0', number=1) +
... timeit.timeit('10000 < 10000', number=9999)
... )
0.0008467709994874895
看看这些数字有多接近?
我的机器有点快,所以让我们创建一个基线进行比较;这是在 OS X 10.12.5 上运行的 Macbook Pro(Retina,15 英寸,2015 年中)上使用 3.6.1。并且让我们还修复while 循环以在测试中设置i = 0,而不是设置(只运行一次):
>>> import timeit
>>> timeit.timeit('for i in range(10000): pass', number=10000)
1.9789885189966299
>>> timeit.timeit('i=0\nwhile i<10000: True; i+=1', number=10000)
5.172155902953818
糟糕,所以正确运行的while 实际上慢在这里,这是你的前提(和我的!)。
我使用pass 来避免回答有关引用该对象有多快的问题(它很快,但除此之外)。我的时间将比你的机器快 6 倍。
如果您想探索为什么迭代更快,您可以在 Python 中为 for 循环的各个组件计时,从创建 range() 对象开始:
>>> timeit.timeit('range(10000)', number=10000)
0.0036197409499436617
因此,创建 10000 个 range() 对象比运行一个迭代 10k 次的 while 循环需要更多时间。 range() 对象的创建成本高于整数。
这确实涉及全局名称查找,速度较慢,您可以使用setup='_range = range' 使其更快,然后使用_range(1000);这减少了大约 1/3 的时间。
接下来,为此创建一个迭代器;这里我将为iter() function 使用本地名称,因为for 循环不必进行哈希表查找,而只需使用C 函数即可。当然,对二进制内存位置的硬编码引用要快得多:
>>> timeit.timeit('_iter(r)', setup='_iter = iter; r = range(10000)', number=10000)
0.0009729859884828329
相当快,但是;它与您的单个 while 循环迭代 10k 次所花费的时间相同。所以创建可迭代对象很便宜。 C 实现仍然更快。我们还没有迭代。
最后,我们在迭代器对象上调用__next__ 10k 次。这再次在 C 代码中完成,缓存了对内部 C 实现的引用,但是使用 functools.partial() object 我们至少可以尝试得到一个大致的数字:
>>> timeit.timeit('n()', setup='from functools import partial; i = iter(range(10000)); n = partial(i.__next__)', number=10000) * 10000
7.759470026940107
男孩,对 iter(range(1000)).__next__ 的 10k 次 10k 次调用所花费的时间几乎是 for 循环管理的 4 倍;这表明实际的 C 实现是多么高效。
但是,它确实说明了 C 代码中的循环要快得多,这就是为什么 while 循环在正确执行时实际上更慢的原因;在字节码中对整数求和并进行布尔比较比在 C 代码中迭代 range() 需要更多的时间(CPU 直接在 CPU 寄存器中进行递增和比较):
>>> (
... timeit.timeit('9999 + 1', number=10000 ** 2) +
... timeit.timeit('9999 < 10000', number=10000 ** 2)
... )
3.695550534990616
正是这些操作使while 循环慢了大约 3 秒。
TLDR:您实际上没有正确测试while 循环。我也应该早点注意到这一点。