经典四讲贯通C++排序之三 交换排序

开发 后端
经典四讲这四篇文章主要介绍C++数据结构排序知识,笔者把这四篇文章分为四个部分,分别介绍C++排序中插入排序、希尔排序、交换排序以及选择排序。本文是这次系列文章的第三篇,主要介绍交换排序。

  我们都知道C++排序方法中,有四种常用方法插入排序希尔排序交换排序以及选择排序。在前面两篇文章中,我们介绍了C++两种排序方法——插入排序和希尔排序,这篇文章我们介绍C++排序的第三种方法——交换排序。(本系列文章统一 测试程序

  交换排序

  基本思想是:两两比较待排序记录的关键码,如果发生逆序,则交换之,直到所有对象都排好为止。

  起泡排序

  起泡排序是比较相邻的两个记录,逆序则交换。这样的做法导致小的关键码一层层的浮上来,因此得名。51cto的论坛曾经讨论过“冒泡”和“起泡”是不是一个东西,看来这是翻译惹的祸,英文名都是Bubble Sort,具体写的时候可以正着排,也可以倒着排。(严版是从后往前排,殷版是从前往后排,好在两本书都翻译为“起泡排序”,不然就正像某些人得出的结论——一个是从后往前排,一个是从前往后排)

  1. template <class T>  
  2. void BubbleSort(T a[], int N, int& KCN, int& RMN)  
  3. {  
  4. KCN = 0; RMN = 0; bool exchange = true;  
  5. for (int i = 1; i < N && exchange; i++)  
  6. for (int j = N - 1; j >= i; j--)  
  7. {  
  8. exchange = false;  
  9. if (++KCN && a[j - 1] > a[j]) { swap(a[j - 1], a[j]); exchange = true; RMN += 3; }  
  10. }  

  需要注意的是,不要写成下面这个样子,虽然结果是对的:

  1. template <class T>  
  2. void BubbleSort2(T a[], int N)  
  3. {  
  4. for (int i = 0; i < N; i++)  
  5. for (int j = 1; j < N - i; j++)  
  6. if (a[j - 1] > a[j]) swap(a[j - 1], a[j]);  

  测试结果:

  1. Sort ascending N=10000 TimeSpared: 0ms  
  2. KCN=9999 KCN/N=0.9999 KCN/N^2=9.999e-005 KCN/NlogN=0.07525  
  3. RMN=0 RMN/N=0 RMN/N^2=0 RMN/NlogN=0  
  4. Sort randomness N=10000 TimeSpared: 1161ms  
  5. KCN=45409094 KCN/N=4540.91 KCN/N^2=0.454091 KCN/NlogN=341.737  
  6. RMN=71526984 RMN/N=7152.7 RMN/N^2=0.71527 RMN/NlogN=538.294  
  7. Sort descending N=10000 TimeSpared: 1022ms  
  8. KCN=49995000 KCN/N=4999.5 KCN/N^2=0.49995 KCN/NlogN=376.25  
  9. RMN=149985000 RMN/N=14998.5 RMN/N^2=1.49985 RMN/NlogN=1128.75 

  可以看出,效率非常的差,还不如直插排序,真不知道为什么人们对此津津乐道,难道是为了理解快速排序?另外还有一个有趣的现象,虽然逆序的KCN和RMN都比乱序的多,但是逆序花的时间却比乱序少,从这里可以看到CPU流水线的作用,这里可以给我们一个信号,一个真正好的算法需要充分利用硬件的特性。增多记录数目(N=1000000)时,可以看出,在完全有序的情况下,起泡比直插要好一些,因为此时不需要移动记录。

#p#

  快速排序

  真为这个算法感到悲哀,连一个能表明算法实质的名字(比如直插、表插)都没有,也不像希尔排序是以发明人的名字命名的,难道就是因为它太快了?也许“快速”是对一个排序算法最高的荣誉吧。

  基本思想是:任取待排序列的某个记录作为基准,按照该关键码大小,将整个序列分成两个序列——左侧的所有记录的关键码都比基准小(或者等),右侧的都比基准大,基准则放在两个子序列之间,显然这时基准放在了最后应该放置的位置。分别对左右子序列重复上面的过程,直到最后所有的记录都放在相应的位置。

  下面的例程不容易看懂,因为这是几次改进之后的样子:

  1. template <class T> 
  2. int Partition(T a[], int left, int right, int& KCN, int& RMN)  
  3. {  
  4. int pivotpos = left; T pivot = a[left];//枢轴  
  5. for (int i = left + 1; i <= right; i++)  
  6. if (++KCN && a[i] < pivot && ++pivotpos != i)  
  7. { swap(a[i], a[pivotpos]); RMN += 3;}  
  8. swap(a[left], a[pivotpos]); RMN += 3;  
  9. return pivotpos;  
  10. }  

  将计算枢轴位置单独作为一个函数,可以避免递归的时候保存无用的临时变量。当你决定使用递归的时候,都要注意这点——将一切可以放在递归外面的都放在外面。注意这个函数是怎样达到我们“枢轴左边都比它小,右边都比它大”的目的。

  1. template <class T>  
  2. void QSRecurve(T a[], int left, int right, int& KCN, int& RMN)  
  3. {  
  4. if (left < right)  
  5. {  
  6. int pivotpos = Partition(a, left, right, KCN, RMN);  
  7. QSRecurve(a, left, pivotpos - 1, KCN, RMN);  
  8. QSRecurve(a, pivotpos + 1, right, KCN, RMN);  
  9. }  
  10. }  
  11. template <class T>  
  12. void QuickSort(T a[], int N, int& KCN, int& RMN)  
  13. {  
  14. KCN = 0; RMN = 0;  
  15. QSRecurve(a, 0, N - 1, KCN, RMN);  
  16. }  

  这两个只能算个外壳了,尤其是最后一个。

  测试结果:

  1. Sort ascending N=10000 TimeSpared: 1051ms  
  2. KCN=49995000 KCN/N=4999.5 KCN/N^2=0.49995 KCN/NlogN=376.25  
  3. RMN=29997 RMN/N=2.9997 RMN/N^2=0.00029997 RMN/NlogN=0.22575  
  4. Sort randomness N=10000 TimeSpared: 0ms  
  5. KCN=155655 KCN/N=15.5655 KCN/N^2=0.00155655 KCN/NlogN=1.17142  
  6. RMN=211851 RMN/N=21.1851 RMN/N^2=0.00211851 RMN/NlogN=1.59434  
  7. Sort descending N=10000 TimeSpared: 1082ms  
  8. KCN=49995000 KCN/N=4999.5 KCN/N^2=0.49995 KCN/NlogN=376.25  
  9. RMN=29997 RMN/N=2.9997 RMN/N^2=0.00029997 RMN/NlogN=0.22575 

  可以看到,平均性能非常好,但是在两端的性能还不如直插。测试N=100000的情况如下(千万记住把正序和逆序的测试注释掉,否则,到时候“死机”不要找我)

  1. Sort randomness N=100000 TimeSpared: 110ms  
  2. KCN=2123221 KCN/N=21.2322 KCN/N^2=0.000212322KCN/NlogN=1.27831  
  3. RMN=3010848 RMN/N=30.1085 RMN/N^2=0.000301085RMN/NlogN=1.81271  

  确实非常的“快速”,但是它的最坏情况实在让人不能放心,万一……,并且由于使用堆栈递归,出了最坏情况没准程序就崩溃了。为了减低这种不良倾向,改进办法是“三者取中”,即选取待排序序列的第一个、最后一个、中间一个的关键码居中的那个作为基准。只要改一下Partition函数就可以了。

  1. template <class T>  
  2. int Partition(T a[], int left, int right, int& KCN, int& RMN)  
  3. {  
  4. int mid = (left + right) / 2;  
  5. if (++KCN && a[left] > a[mid])  
  6. {  
  7. if (++KCN && a[left] > a[right])  
  8. {  
  9. if (++KCN && a[mid] > a[right]) { swap(a[mid], a[left]); RMN += 3; }  
  10. else { swap(a[right], a[left]); RMN += 3; }  
  11. }  
  12. }  
  13. else 
  14. {  
  15. if (++KCN && a[left] < a[right])  
  16. {  
  17. if (++KCN && a[mid] < a[right]) { swap(a[mid], a[left]); RMN += 3; }  
  18. else { swap(a[right], a[left]); RMN += 3; }  
  19. }  
  20. }  
  21. int pivotpos = left; T pivot = a[left];//枢轴  
  22. for (int i = left + 1; i <= right; i++)  
  23. if (++KCN && a[i] < pivot && ++pivotpos != i) { swap(a[i], a[pivotpos]); RMN += 3;}  
  24. swap(a[left], a[pivotpos]); RMN += 3;  
  25. return pivotpos;  

  只是在原有的Partition函数上添加了粗体部分。下面是测试结果:

  1. Sort ascending N=10000 TimeSpared: 0ms  
  2. KCN=131343 KCN/N=13.1343 KCN/N^2=0.00131343 KCN/NlogN=0.988455  
  3. RMN=35424 RMN/N=3.5424 RMN/N^2=0.00035424 RMN/NlogN=0.266592  
  4. Sort randomness N=10000 TimeSpared: 0ms  
  5. KCN=154680 KCN/N=15.468 KCN/N^2=0.0015468 KCN/NlogN=1.16408  
  6. RMN=204093 RMN/N=20.4093 RMN/N^2=0.00204093 RMN/NlogN=1.53595  
  7. Sort descending N=10000 TimeSpared: 280ms  
  8. KCN=12517506 KCN/N=1251.75 KCN/N^2=0.125175 KCN/NlogN=94.2036  
  9. RMN=45006 RMN/N=4.5006 RMN/N^2=0.00045006 RMN/NlogN=0.338704  

  下面是N=100000的测试结果,在逆序的时候还是很尴尬,不过还算说得过去。

  1. Sort ascending N=100000 TimeSpared: 60ms  
  2. KCN=1665551 KCN/N=16.6555 KCN/N^2=0.000166555KCN/NlogN=1.00276  
  3. RMN=393210 RMN/N=3.9321 RMN/N^2=3.9321e-005RMN/NlogN=0.236736  
  4. Sort randomness N=100000 TimeSpared: 110ms  
  5. KCN=1888590 KCN/N=18.8859 KCN/N^2=0.000188859KCN/NlogN=1.13704  
  6. RMN=2659857 RMN/N=26.5986 RMN/N^2=0.000265986RMN/NlogN=1.60139  
  7. Sort descending N=100000 TimeSpared: 42120ms  
  8. KCN=1250175006 KCN/N=12501.8 KCN/N^2=0.125018 KCN/NlogN=752.68  
  9. RMN=450006 RMN/N=4.50006 RMN/N^2=4.50006e-005RMN/NlogN=0.270931 

  然而实际上,我们花那么多语句搞一个“三者取中”还不如直接“随便选一个”来得高效,例如将下面的语句替换掉原来的粗体语句:

  1. swap(a[left], a[rnd(right-left)+left]); RMN += 3; 

  测试结果:

  1. Sort ascending N=100000 TimeSpared: 90ms  
  2. KCN=1917756 KCN/N=19.1776 KCN/N^2=0.000191776KCN/NlogN=1.1546  
  3. RMN=378810 RMN/N=3.7881 RMN/N^2=3.7881e-005RMN/NlogN=0.228066  
  4. Sort randomness N=100000 TimeSpared: 120ms  
  5. KCN=1979189 KCN/N=19.7919 KCN/N^2=0.000197919KCN/NlogN=1.19159  
  6. RMN=3175977 RMN/N=31.7598 RMN/N^2=0.000317598RMN/NlogN=1.91213  
  7. Sort descending N=100000 TimeSpared: 110ms  
  8. KCN=2069369 KCN/N=20.6937 KCN/N^2=0.000206937KCN/NlogN=1.24588  
  9. RMN=2574174 RMN/N=25.7417 RMN/N^2=0.000257417RMN/NlogN=1.54981  

  可以看到逆序的效率有了质的飞跃,随机函数得自己写,因为库函数的rand()最大只能输出0x7fff,这是因为rand函数使用的是32bit的整数,为了不溢出(最严重的是出负数),只能输出那么大。一个不太严格的随机函数如下,最大输出值是32bit的最大正整数:

  1. int rnd(int n)  
  2. {  
  3. static _int64 x;  
  4. x = (2053 * x + 13849) % 0x7fffffff;  
  5. return (int)x % n;  

【编辑推荐】

  1. 几种常用的C#排序方法简介
  2. 四种C#排序算法代码示例
  3. C++冒泡排序基本应用技巧分享
  4. c++编程常用工具
  5. 给C++初学者的50个忠告
  6. c++最基础的20条规则
  7. 深入剖析C/C++程序员应聘常见面试题
  8. 程序员必看 c++笔试题汇总
责任编辑:韩亚珊 来源: 天极网
相关推荐

2011-04-11 14:52:18

选择排序排序C++

2011-04-11 14:21:43

希尔排序排序C++

2011-04-11 13:41:34

插入排序排序C++

2011-04-11 16:10:55

无向图C++

2011-04-11 16:19:56

C++

2011-04-11 16:32:28

路径C++

2021-01-19 07:02:26

算法数据结构堆排序

2011-04-11 16:43:51

AOVAOE活动网络

2011-04-11 15:57:22

DFSBFSC++

2011-04-11 15:53:40

C++

2021-10-29 09:44:50

C++指针变量

2011-04-20 14:19:00

希尔排序

2011-04-20 14:07:37

冒泡排序

2021-01-21 05:22:36

排序算法选择

2021-01-26 05:33:07

排序算法快速

2021-02-16 10:57:34

C++ C 语言windows

2010-02-06 16:16:01

C++冒泡排序

2009-08-26 18:14:11

C#排序算法

2009-09-08 17:20:01

C#排序算法

2023-06-09 09:32:52

DeepMindC++库算法
点赞
收藏

51CTO技术栈公众号