【问题标题】:3 way quicksort (C implementation)3路快速排序(C实现)
【发布时间】:2017-05-09 13:21:40
【问题描述】:

我尝试implement 一些使用 C 的纯泛型算法。我坚持使用 3 路快速排序,但不知何故,实现没有给出正确的输出。输出几乎已排序,但某些键不在应有的位置。代码如下。提前致谢。

#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <time.h>

static void swap(void *x, void *y, size_t size) {
    void *tmp = malloc(size);

    memcpy(tmp, x, size);
    memcpy(x, y, size);
    memcpy(y, tmp, size);

    free(tmp);
}

static int cmpDouble(const void *i, const void *j) {
    if (*(double *)i < *(double *)j)
        return 1;
    else if (*(double *)i == *(double *)j)
        return 0;
    else 
        return -1;
}

void qsort3way(void *base, int lo, int hi, size_t size,
               int (*cmp)(const void *, const void *)) {
    if (hi <= lo)
        return;
    else {
        char *ptr = (char*)base;
        char *v = ptr + lo * size;

        int lt = lo, gt = hi;
        int i = lo;
        while (i <= gt) {
            int c = cmp(v, ptr + i * size);
            if (c < 0)
                swap(ptr + (lt++) * size, ptr + (i++) * size, size);
            else if (c > 0)
                swap(ptr + i * size, ptr + (gt--) * size, size);    
            else 
                i++;
        }

        qsort3way(base, lo, lt - 1, size, cmp);
        qsort3way(base, gt + 1, hi, size, cmp);
    }     
}

int main(void) {
    int i;
    double *d = (double*)malloc(sizeof(double) * 100);

    for (i = 0; i < 100; i++)
        d[i] = (double)rand();

    qsort3way(d, 0, 100 -1, sizeof(double), cmpDouble);

    for (i = 0; i < 100; i++)
        printf("%.10lf\n", d[i]);

    free(d);
    return 0;
}

样本输出:

41.0000000000 153.0000000000 288.0000000000 2082.0000000000 292.0000000000 1869.0000000000 491.0000000000 778.0000000000 1842.0000000000 6334.0000000000 2995.0000000000 8723.0000000000 3035.0000000000 3548.0000000000 4827.0000000000 3902.0000000000 4664.0000000000 5436.0000000000 4966.0000000000 5537.0000000000 5447.0000000000 7376.0000000000 5705.0000000000 6729.0000000000 6868.0000000000 7711.0000000000 9961.0000000000 8942.0000000000 9894.0000000000 9040.0000000000 9741.0000000000

【问题讨论】:

  • @Stargateur:您的意思是将void * 转换为double?这就是您在 C 中编写通用代码的方式。
  • size 是以字节为单位的变量大小。在主函数中,我使用sizeof(double) 传递了double 数据类型的大小。

标签: c sorting quicksort partitioning


【解决方案1】:

阅读您提供给@JohnBollinger 的book link 后。我了解您的算法是如何工作的。您的问题是您的枢轴移动,但您没有更改v 的值。您的支点位于索引lt

char *ptr = base;

int lt = lo, gt = hi; // lt is the pivot
int i = lo + 1; // we don't compare pivot with itself
while (i <= gt) {
  int c = cmp(ptr + lt * size, ptr + i * size);
  if (c < 0) {
    swap(ptr + lt++ * size, ptr + i++ * size, size);
  }
  else if (c > 0)
    swap(ptr + i * size, ptr + gt-- * size, size);
  else
    i++;
}
qsort3way(base, lo, lt - 1, size, cmp);
qsort3way(base, gt + 1, hi, size, cmp);

我建议你一个“正确”的解决方案:

#include <stdio.h>
#include <stdlib.h>
#include <time.h>

typedef void qsort3way_swap(void *a, void *b);
typedef int qsort3way_cmp(void const *a, void const *b);

static void qsort3way_aux(char *array_begin, char *array_end, size_t size,
                          qsort3way_cmp *cmp, qsort3way_swap *swap) {
  if (array_begin < array_end) {
    char *i = array_begin + size;
    char *lower = array_begin;
    char *greater = array_end;
    while (i < greater) {
      int ret = cmp(lower, i);
      if (ret < 0) {
        swap(i, lower);
        i += size;
        lower += size;
      } else if (ret > 0) {
        greater -= size;
        swap(i, greater);
      } else {
        i += size;
      }
    }
    qsort3way_aux(array_begin, lower, size, cmp, swap);
    qsort3way_aux(greater, array_end, size, cmp, swap);
  }
}

static void qsort3way(void *array_begin, void *array_end, size_t size,
                      qsort3way_cmp *cmp, qsort3way_swap *swap) {
  qsort3way_aux(array_begin, array_end, size, cmp, swap);
}

static void swap_int_aux(int *a, int *b) {
  int tmp = *a;
  *a = *b;
  *b = tmp;
}

static void swap_int(void *a, void *b) { swap_int_aux(a, b); }

static int cmp_int_aux(int const *a, int const *b) {
  if (*a < *b) {
    return 1;
  } else if (*a > *b) {
    return -1;
  } else {
    return 0;
  }
}

static int cmp_int(void const *a, void const *b) { return cmp_int_aux(a, b); }

static void print_int(char const *intro, int const *array, size_t const size) {
  printf("%s:", intro);
  for (size_t i = 0; i < size; i++) {
    printf(" %d", array[i]);
  }
  printf("\n");
}

#define SIZE 42

int main(void) {
  int array[SIZE];

  srand((unsigned int)time(NULL));
  for (size_t i = 0; i < SIZE; i++) {
    array[i] = rand() % SIZE - SIZE / 2;
  }

  print_int("before", array, SIZE);

  qsort3way(array, array + SIZE, sizeof *array, cmp_int, swap_int);

  print_int("after", array, SIZE);
}

注意:优化int i = lo + 1;char *i = array_begin + size; 是强制性的。因为在函数比较返回 pivot != pivot 的情况下,这将导致无限递归。这怎么可能?

  1. cmp 函数有 bug。
  2. double 有一种奇怪的力量... double 不能等于它自己! (-nan)。

【讨论】:

  • 要成为一个有用的答案,它需要解释 OP 代码中的缺陷以及您提供的代码如何修复它们。
  • @JohnBollinger 我恨你,调试是一场噩梦。
  • 真相很痛,@Star,也祝你圣诞快乐。但在这里,+1 用于发现神奇的移动枢轴。
  • @Stargateur 哇!我真的很感谢你的努力..!您在最新编辑之前的帖子解决了问题。 Joyeux noël..
  • 只是一点点,swap_int 不应返回一个值,qsort3way_swaptypedef 不应接受/忽略 const 指针。
【解决方案2】:

实现没有给出正确的结果,因为它是错误的。考虑到它应该是三向快速排序而不是常规快速排序,实际上是非常严重的错误。

一个基本问题是您在主分区循环之后省略了将枢轴移动到正确位置的位。对于标准快速排序,这需要在循环之后进行一次额外的交换或分配,具体取决于实现细节。对于一个三向快速排序,它涉及一个或两个额外的循环,以将等于枢轴的潜在多值移动到它们的位置。

一个更隐蔽的问题是@Stargateur 首先指出的问题:您通过指针而不是值跟踪枢轴元素,并且(有时)在分区循环过程中将原始值从该位置换出。

此外,您的主分区循环对于三向快速排序也是错误的。当您遇到一个等于枢轴的元素时,您只需将其留在原处,但您需要将其移动到一端或另一端(或某种辅助存储,如果您愿意承担内存成本)所以您可以在最后执行向中间的移动。从某种意义上说,前一个问题是这个问题的一个特例——你没有为枢轴值保留空间或跟踪。解决这个问题也可以解决之前的问题。

我不确定您使用什么参考来准备您的实现,或者您是否从头开始构建它,但 Geeks for Geeks 有一个 C++(但也几乎是 C)implementation for int arrays,您可能想查看它。

【讨论】:

  • "..您通过指针而不是值来跟踪枢轴元素..."。好吧,编写一个纯泛型函数需要它。语言 (C) 本身不支持泛型编程,因此我们需要处理指针算术并处理 void 指针。我以 Sedgewick 的算法 4 版 book 作为参考。最后,如果我是你,在写这么多段落之前,首先提出一个解决方案。
【解决方案3】:

您的实现不正确,因为枢轴可能在分区阶段移动,并且您使用不再指向它的比较指针。其他语言的实现使用枢轴的值而不是其地址。

还要注意这些缺点:

  • 双向递归可能会导致病态分布的堆栈溢出。在您的情况下,已经排序的数组病态分布。
  • 比较函数应该返回相反的值:-1 如果a &lt; b+1a &gt; b0 如果a == b
  • API 不标准且令人困惑:您应该传递元素的数量而不是包含边界的范围。

这是一个更正和评论的版本:

#include <stdio.h>
#include <stdlib.h>

static void swap(unsigned char *x, unsigned char *y, size_t size) {
    /* sub-optimal, but better than malloc */
    while (size-- > 0) {
        unsigned char c = *x;
        *x++ = *y;
        *y++ = c;
    }
}

void qsort3way(void *base, int n, size_t size,
               int (*cmp)(const void *, const void *))
{
    unsigned char *ptr = (unsigned char *)base;

    while (n > 1) {
        /* use first element as pivot, pointed to by lt */
        int i = 1, lt = 0, gt = n;
        while (i < gt) {
            int c = cmp(ptr + lt * size, ptr + i * size);
            if (c > 0) {
                /* move smaller element before the pivot range */
                swap(ptr + lt * size, ptr + i * size, size);
                lt++;
                i++;
            } else if (c < 0) {
                /* move larger element to the end */
                gt--;
                swap(ptr + i * size, ptr + gt * size, size);
                /* test with that element again */
            } else {
                /* leave identical element alone */
                i++;
            }
        }
        /* array has 3 parts:
         * from 0 to lt excluded: elements smaller than pivot
         * from lt to gt excluded: elements identical to pivot
         * from gt to n excluded: elements greater than pivot
         */
        /* recurse on smaller part, loop on larger to minimize
           stack use for pathological distributions */
        if (lt < n - gt) {
            qsort3way(ptr, lt, size, cmp);
            ptr += gt * size;
            n -= gt;
        } else {
            qsort3way(ptr + gt * size, n - gt, size, cmp);
            n = lt;
        }
    }
}    

static int cmp_double(const void *i, const void *j) {
    /* this comparison function does not handle NaNs */
    if (*(const double *)i < *(const double *)j)
        return -1;
    if (*(const double *)i > *(const double *)j)
        return +1;
    else
        return 0;
}

int main(void) {
    double d[100];
    int i;

    for (i = 0; i < 100; i++)
        d[i] = rand() / ((double)RAND_MAX + 1);

    qsort3way(d, 100, sizeof(*d), cmp_double);

    for (i = 0; i < 100; i++)
        printf("%.10lf\n", d[i]);

    return 0;
}

【讨论】:

    猜你喜欢
    • 2020-09-04
    • 1970-01-01
    • 2011-03-29
    • 2017-02-18
    • 1970-01-01
    • 2019-11-20
    • 1970-01-01
    • 2016-10-02
    相关资源
    最近更新 更多