【发布时间】:2014-03-24 21:33:14
【问题描述】:
我最近了解到人们如何努力使快速排序更快。从随机选择枢轴元素到切换到较小数组的插入排序,甚至使用 3 路分区处理相等的键。我很好奇随机生成的数据是如何工作的,并想分析一些 python 代码。我附上下面的脚本。问题是脚本最终花费了相同的时间!当我使用 %prun 时,看起来快速排序被调用的次数也非常相似。所以,我们所做的所有改进只有在我们的数据遇到最坏的情况时才有用(非常错误地排序?)
def hoare_partition(a, lo, hi):
if lo >= hi or (lo + 1) == len(a) - 1:
return None
pivot = a[lo]
left = lo + 1
right = hi
while left <= right and right < len(a):
while left < len(a) and a[left] < pivot:
left += 1
while a[right] > pivot:
right -= 1
if left <= right and right < len(a):
a[left], a[right] = a[right], a[left]
left += 1
right -= 1
a[lo], a[right] = a[right], a[lo]
return right
def hoare_quicksort(a, lo, hi):
''' this is a vanilla implementation of quick sort. this will call the partition method that uses first element as pivot '''
if lo < hi:
p = hoare_partition(a, lo, hi)
if p:
#print 'calling for ', lo, p - 1
hoare_quicksort(a, lo, p - 1)
#print 'calling for ', p + 1, hi
hoare_quicksort(a, p + 1, hi)
这是我们选择第一个元素本身作为枢轴的普通实现。然后,我改为选择中点。
所以,换了一行
mid = lo + (hi - lo)//2
a[lo], a[mid] = a[mid], a[lo]
pivot = a[lo]
然后我也做随机枢轴选择,像这样:
pos = random.randint(lo, hi + 1)
a[lo], a[pos] = a[pos], a[lo]
pivot = a[lo]
现在,我用
来称呼他们%prun hoare_quicksort([random.randint(0, 10000) for i in xrange(1000)], 0, 999)
%prun mid_quicksort([random.randint(0, 10000) for i in xrange(1000)], 0, 999)
%prun random_quicksort([random.randint(0, 10000) for i in xrange(1000)], 0, 999)
所有这些都花费几乎相同的时间(5.22、5.27、5.61 毫秒)。当我使用 %prun 调用它们并查看调用快速排序的次数时,我再次得到非常相似的数字。那么,怎么了?
【问题讨论】: