【问题标题】:Error "maximum recursion depth exceeded" while sorting a list with Quicksort使用快速排序对列表进行排序时出现“超出最大递归深度”错误
【发布时间】:2018-10-15 20:15:31
【问题描述】:

我试图用快速排序算法对一个几乎排序的 100,000 个数字列表进行排序,但我收到了这个错误:

Traceback (most recent call last):
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 48, in <module>
    quickSort(alist)
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 5, in quickSort
    quickSortHelper(alist,0,len(alist)-1)
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 12, in quickSortHelper
    quickSortHelper(alist,first,splitpoint-1)
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 12, in quickSortHelper
    quickSortHelper(alist,first,splitpoint-1)
.
.
(a bunch of the last line)
.
.
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 10, in quickSortHelper
    splitpoint = partition(alist,first,last)
  File "/Users/MacbookPro/Documents/Faculta/alg sortare pyth/quicksort.py", line 25, in partition
    while leftmark <= rightmark and alist[leftmark] <= pivotvalue:
RuntimeError: maximum recursion depth exceeded in cmp

这是我的代码:

from timeit import default_timer as timer
import resource

start = timer()

def quickSort(alist):
   quickSortHelper(alist,0,len(alist)-1)

def quickSortHelper(alist,first,last):
   if first<last:    
       splitpoint = partition(alist,first,last)    
       quickSortHelper(alist,first,splitpoint-1)
       quickSortHelper(alist,splitpoint+1,last)


def partition(alist,first,last):
   pivotvalue = alist[first]    
   leftmark = first+1
   rightmark = last    
   done = False
   while not done:    
       while leftmark <= rightmark and alist[leftmark] <= pivotvalue:
           leftmark = leftmark + 1    
       while alist[rightmark] >= pivotvalue and rightmark >= leftmark:
           rightmark = rightmark -1    
       if rightmark < leftmark:
           done = True
       else:
           temp = alist[leftmark]
           alist[leftmark] = alist[rightmark]
           alist[rightmark] = temp    
   temp = alist[first]
   alist[first] = alist[rightmark]
   alist[rightmark] = temp   
   return rightmark

with open('lista.txt', 'r') as f:
    long_string = f.readline()
    alist = long_string.split(',')
quickSort(alist)
f = open("quick.txt", "w")
print >>f,(alist)
print resource.getrusage(resource.RUSAGE_SELF).ru_maxrss / 1000
end = timer()
print(end - start)
f.close()
print 'Quick\n'

我之前尝试过对同一个列表进行排序,在先随机洗牌之后,然后它起作用了。

【问题讨论】:

  • 有点不清楚你想用你的程序做什么。你能再深入一点吗?
  • 我正在尝试对实验的不同列表进行排序(1000、100,000、1,000,000 个元素的列表,未排序,几乎排序和降序排序)。

标签: python-2.7 sorting quicksort


【解决方案1】:

当输入已经排序时,您选择的枢轴元素(范围中的最左侧)将给出“错误”拆分。 “坏”的意思是 partition 将返回一个等于 first 的值的 rightmark

这意味着在 quickSortHelper 中,一个 n 值的列表将被拆分为一个包含零元素的列表(第一次递归调用)和一个 n 的列表-1 值(第二次递归调用)。如果输入已经排序,则此模式将在每个递归级别上不断重复。因此,如果您的输入大小为 1000,那么您将拥有 1000 的递归深度。Python 会维护一个最大递归深度,在该深度时它将触发异常。对于大型排序列表,您将遇到此限制。

附带说明,在这种情况下,您的最坏情况运行时间也为 O(n²)

如何解决?

您可以将 Python 配置为 allow deeper recursion,使用 sys.setrecursionlimit。但这并不可取,因为这意味着您仍然会使用大量堆栈内存,并且不要摆脱排序输入的最坏情况运行时间。

解决此问题的更好方法是随机选择您的枢轴元素,在索引 firstlast 之间的某个位置,然后将该索引处的值与最左边的值交换(或最右边,但在您的实现中它会被留下)。这会将超出最大递归深度错误的概率降低到几乎为零。

另请参阅Wikipedia 如何指代您遇到的问题(我用粗体强调):

支点的选择

在快速排序的早期版本中,分区的最左侧元素通常会被选为枢轴元素。不幸的是,这会导致已经排序的数组出现最坏情况,这是一个相当常见的用例。 通过为枢轴选择随机索引、选择分区的中间索引或(特别是对于较长的分区)选择第一个的中位数,这个问题很容易解决,枢轴分区的中间和最后一个元素(由 Sedgewick 推荐)。

要实现随机选择的枢轴索引,请将这两行添加到 partition 函数的最顶部:

pivotmark = random.randint(first,last)
alist[first], alist[pivotmark] = alist[pivotmark], alist[first]

当然,你需要import random

这将解决您遇到的问题。如果您想进一步提高性能,您可以查看现有的其他几种解决方案,例如上面引用的 Wikipedia 文章中提到的解决方案,并了解它们在您处理的输入上的表现。

注意:另请参阅如何在一行中交换元素...

【讨论】: