你所能用到的数据结构（五）-数据结构(第5版)

七、骚年，这就是你的***速度了吗？

在介绍了前面的几个排序算法之后，这一次我准备写写快速排序，快速排序之所以叫快速排序是因为它很快，它是已知实践中最快的排序算法（不过曾经我看过一个叫google的位图排序算法，传说能更快，但从那以后我再也没有找到过相关的资料了，所以说江湖小报上的消息还是不要信的比较好），它的平均运行时间能达到O（NLOGN），而且在绝大部分情况下很容易达到这个时间界。

快速排序算法过程分为如下几步：

1.如果数列中的元素只有0个或者1个，那么算法结束，

2.在待排序数列中任意选取一个数，记为p好了，

3.将剩下的元素划分成两个子序列，一个子序列里面的数全部比p小，另一个全部比p大，

4.分别对两个子序列进行上述过程的排序。

看完这四步，我相信很多人又要开始退缩了，这里面又有递归，其实不用怕，仔细分析一下先，快速排序和归并排序挺像的，可以看出来这是一个思想的延伸，不同的是归并排序在递归（排序）之前并不对数列进行任何处理，而快速排序是要进行一些排序的预处理，得到两个子序列，然后再将这两个子序列进行排序。在这里面要特别提到的一个就是如何选取p值对于这个算法的效率是有影响的，这也是快速排序很微妙的一个事情，基本思想说完了，惯例是贴个代码了。

void quickSort(int numbers[], int array_size) 
{ 
  q_sort(numbers, 0, array_size - 1); 
} 
 
 
 
void q_sort(int numbers[], int left, int right) 
{ 
  int pivot, l_hold, r_hold; 
 
  l_hold = left; 
  r_hold = right; 
  pivot = numbers[left]; 
  while (left < right) 
  { 
    while ((numbers[right] >= pivot) && (left < right)) 
      right--; 
    if (left != right) 
    { 
      numbers[left] = numbers[right]; 
      left++; 
    } 
    while ((numbers[left] <= pivot) && (left < right)) 
      left++; 
    if (left != right) 
    { 
      numbers[right] = numbers[left]; 
      right--; 
    } 
  } 
  numbers[left] = pivot; 
  pivot = left; 
  left = l_hold; 
  right = r_hold; 
  if (left < pivot) 
    q_sort(numbers, left, pivot-1); 
  if (right > pivot) 
    q_sort(numbers, pivot+1, right); 
}

***个函数你可以理解为一个驱动程序，为的是隐藏一些实现细节，让调用者调用时传递更少的参数，减小出错的可能性，这也是一种有技巧的设计方法。第二个函数是真正的快速排序函数，从代码上看，这里选取每个序列的***个点作为p点，然后分别从两端开始和这个p点进行比较，先从右端一直找到***个小于p点的值，然后停住，交换左端左边现在扫描到的值（也就是p点的值），两个值，然后换从左边开始扫描，找到目前比p点大值，交换，如此继续，***当从左端扫描的坐标和右端扫描的坐标相遇时，记下这个点，将p点和这个点的值交换，这样就可以保证p点左边的值都是比p点的值小（但是不一定是有序的），右边的值都比p点的值要大，如此循环，然后依次对两个子序列进行一样的排序过程，因为在上一篇里我已经详细的分析了递归的调用过程，所以在这里我就不再分析了，唉，人还是懒的。

先看下效果好了。

分析下结果好了，就看***行，***行里面我们选取的p是34，那么从右端开始，81大于34，不用交换，继续扫描，12小于34，交换两个值，12交换到***位，34交换到倒数第二位，现在换从左边扫描，43大于34，又开始交换，43变到倒数第二位，34交换到第二位，如此往复，得到以34为分界点的，左边的序列的元素全部比34小，右边的元素全部比34大。

下面来简单说明一下为什么p点的选取对于快速排序的效率有一定的影响，因为看到第三步，是要将序列划分成为两个序列然后进行递归，试想如果一个逆序的数列，也就是54321这种，如果按照我们上述的方法选取p点，会出现的问题就是划分成了的两个子序列，一个子序列里面是原数列的所有数，一个子序列里面没有数，这样会导致效率的大大降低。那么如果是随机选取p点呢？这样会减少我上面说的这个问题，但是会带来的负面效应就是随机数的生成也是要耗费大量时间的，所以说这也是一种得不偿失的方法。那么有没有好一点的方法呢？有一种通用的方法叫做三中值分割法，如果让快速排序效率尽量高，那么我们的选取的p值尽量是中值，这样的话分成的两个序列比较平均，其实就是对于一个带排列的数列，选取其中间位置上的那个元素，在实践中，因为大部分应用背景的关系，所以这样的方法往往能神奇的提高效率。

原文链接：http://www.cnblogs.com/ZXYloveFR/archive/2012/09/27/2705463.html

【编辑推荐】