经典四讲贯通C++排序之一 插入排序

开发 后端
经典四讲这四篇文章主要介绍C++数据结构排序知识,笔者把这四篇文章分为四个部分,分别介绍C++排序中插入排序、希尔排序、交换排序以及选择排序。本文是这次系列文章的第一篇,主要介绍插入排序。

  我们都知道C++排序方法中,有四种常用方法插入排序希尔排序交换排序以及选择排序。这篇文章我们介绍插入排序。在介绍插入之前,先引入我们整个系列文章中的测试程序。

  测试程序

  后面的例程,都是对数组的排序,使用静态链表的也适用于链表的排序。为简单起见,只对单关键码排序,并且***的结果都是从头到尾按升序排列。下面是统一的测试程序:

  1. #include   
  2. #include   
  3. using namespace std;  
  4. #include   
  5. #include   
  6. #include   
  7. #include "InsertSort.h"  
  8. #define random(num) (rand() % (num))  
  9. #define randomize() srand((unsigned)time(NULL))  
  10. #define N 10000 //排序元素的数目  
  11. #define SORT InsertSort //排序方法  
  12. class timer//单位ms  
  13. {  
  14. public:  
  15. void start() { start_t = clock(); }  
  16. clock_t time() { return (clock() - start_t); }  
  17. private:  
  18. clock_t start_t;  
  19. };  
  20. int KCN, RMN; timer TIMER;  
  21. void test(int a[])  
  22. {  
  23. TIMER.start();  
  24. SORT<int>(a, N, KCN, RMN);  
  25. cout << "\tTimeSpared: " << TIMER.time() << "ms" << endl;  
  26. cout << "KCN=" << left << setw(11) << KCN;   
  27. cout << "KCN/N=" << left << setw(11)<< (double)KCN/N;  
  28. cout << "KCN/N^2=" << left << setw(11)<< (double)KCN/N/N;  
  29. cout << "KCN/NlogN=" << left << setw(11)<< (double)KCN/N/log((double)N)*log(2.0) << endl;  
  30. cout << "RMN=" << left << setw(11) << RMN;  
  31. cout << "RMN/N=" << left << setw(11)<< (double)RMN/N;  
  32. cout << "RMN/N^2=" << left << setw(11)<< (double)RMN/N/N;  
  33. cout << "RMN/NlogN=" << left << setw(11)<< (double)RMN/N/log((double)N)*log(2.0) << endl;  
  34. }  
  35. int main()  
  36. {  
  37. int i;  
  38. //randomize();为了在相同情况下比较各个排序算法,不加这句  
  39. int* ascending = new int[N];//升序序列  
  40. int* descending = new int[N];//降序序列  
  41. int* randomness = new int[N];//随机序列  
  42. for (i = 0; i < N; i++) { ascending[i] = i; randomness[i] = i; descending[i] = N - i - 1;}  
  43. for (i = 0; i < N; i++) swap(randomness[i], randomness[random(N)]);  
  44. cout << "Sort ascending N=" << N; test(ascending);  
  45. cout << "Sort randomness N=" << N; test(randomness);  
  46. cout << "Sort descending N=" << N; test(descending);  
  47. return 0;  

  需要说明一点,KCN(关键码比较次数)、RMN(记录移动次数)并不是算法必须的,是为了对算法的性能有个直观的评价(不用那些公式算来算去)。对10000个整数排序应该是最省事的测试手段,建议不要再增多记录数目了,一是在最坏的情况不用等太久的时间,二是避免KCN、RMN溢出,另外有些递归的算法在情况比较糟的时候,记录数目太多堆栈可能会溢出,导致程序崩溃。

#p#

  插入排序

  基本思想是,每步将一个待排序的记录,按其关键码大小,插入到前面已经排好序的记录的适当位置,从头做到尾就可以了。

  直接插入排序

  1. template <class T>  
  2. void InsertSort(T a[], int N, int& KCN, int& RMN)  
  3. {  
  4. KCN = 0; RMN = 0;  
  5. for (int i = 1; i < N; i++)  
  6. {  
  7. T temp = a[i]; RMN++;  
  8. for (int j = i; j > 0 && ++KCN && temp < a[j - 1]; j--) { a[j] = a[j - 1]; RMN++; }  
  9. a[j] = temp; RMN++;  
  10. }  

  精简之后就是这样:

  1. template<class T> void InsertSort(T a[], int N)  
  2. {  
  3. for (int i = 1; i < N; i++)  
  4. {  
  5. T temp = a[i];  
  6. for (int j = i; j > 0 && temp < a[j - 1]; j--) a[j] = a[j - 1];  
  7. a[j] = temp;  
  8. }  

  测试结果:

  1. Sort ascending N=10000 TimeSpared: 0ms  
  2. KCN=9999 KCN/N=0.9999 KCN/N^2=9.999e-005 KCN/NlogN=0.07525  
  3. RMN=19998 RMN/N=1.9998 RMN/N^2=0.00019998 RMN/NlogN=0.1505  
  4. Sort randomness N=10000 TimeSpared: 330ms  
  5. KCN=24293730 KCN/N=2429.37 KCN/N^2=0.242937 KCN/NlogN=182.829  
  6. RMN=24303739 RMN/N=2430.37 RMN/N^2=0.243037 RMN/NlogN=182.904  
  7. Sort descending N=10000 TimeSpared: 711ms  
  8. KCN=49995000 KCN/N=4999.5 KCN/N^2=0.49995 KCN/NlogN=376.25  
  9. RMN=50014998 RMN/N=5001.5 RMN/N^2=0.50015 RMN/NlogN=376.4 

  可以看出,平均性能近似为n2/4。

  折半插入排序

  将直插排序中的搜索策略由顺序搜索变为折半搜索,便能得到此种排序方法。显而易见,只能减少KCN,不能减少RMN,所能带来的性能提升也不会太大。

  1. template<class T>  
  2. void BinaryInsertSort(T a[], int N, int& KCN, int& RMN)  
  3. {  
  4. KCN = 0; RMN = 0;  
  5. for (int i = 1; i < N; i++)  
  6. {  
  7. T temp = a[i]; RMN++; int low = 0, high = i - 1;  
  8. while (low <= high)//折半查找  
  9. {  
  10. int mid = (low + high) / 2;  
  11. if (++KCN && temp < a[mid]) high = mid - 1; else low = mid + 1;  
  12. }  
  13. for (int j = i - 1; j >= low; j--) { a[j + 1] = a[j]; RMN++; }//记录后移  
  14. a[low] = temp; RMN++;//插入  
  15. }  
  16. }  

  测试结果:

  1. Sort ascending N=10000 TimeSpared: 0ms  
  2. KCN=123617 KCN/N=12.3617 KCN/N^2=0.00123617 KCN/NlogN=0.930311  
  3. RMN=19998 RMN/N=1.9998 RMN/N^2=0.00019998 RMN/NlogN=0.1505  
  4. Sort randomness N=10000 TimeSpared: 320ms  
  5. KCN=118987 KCN/N=11.8987 KCN/N^2=0.00118987 KCN/NlogN=0.895466  
  6. RMN=24303739 RMN/N=2430.37 RMN/N^2=0.243037 RMN/NlogN=182.904  
  7. Sort descending N=10000 TimeSpared: 631ms  
  8. KCN=113631 KCN/N=11.3631 KCN/N^2=0.00113631 KCN/NlogN=0.855158  
  9. RMN=50014998 RMN/N=5001.5 RMN/N^2=0.50015 RMN/NlogN=376.4 

  可以看到KCN近似为nlog2n,有一定的性能提升。

  表插入排序

  如果用“指针”来表示记录间的顺序,就可以避免大量的记录移动,当然,***还是要根据“指针”重排一下。自然的,折半查找在这里用不上了。

  1. template <class T>  
  2. void TableInsertSort(T a[], int N, int& KCN, int& RMN)  
  3. {  
  4. KCN = 0; RMN = 0;  
  5. int* link = new int[N]; int head = 0, pre, cur, i; link[0] = -1;  
  6. for (i = 1; i < N; i++)  
  7. {  
  8. if (a[head] > a[i]) { link[i] = head; head = i; KCN++;}//没设表头,因此需要此判断,失败时此次判断没记入KCN  
  9. else   
  10. {  
  11. for (cur = head; cur != -1&& ++KCN && a[cur] <= a[i]; cur = link[cur]) pre = cur;  
  12. link[pre] = i; link[i] = cur;  
  13. }  
  14. }  
  15. cur = head;//重排序列  
  16. for (i = 0; i < N; i++)  
  17. {  
  18. while (cur < i) cur = link[cur];  
  19. pre = link[cur];  
  20. if (cur != i)  
  21. {  
  22. swap(a[i], a[cur]); RMN += 3;  
  23. link[cur] = link[i]; link[i] = cur;  
  24. }  
  25. cur = pre;  
  26. }  
  27. delete []link;  

  测试结果:

  1. Sort ascending N=10000 TimeSpared: 751ms  
  2. KCN=49995000 KCN/N=4999.5 KCN/N^2=0.49995 KCN/NlogN=376.25  
  3. RMN=0 RMN/N=0 RMN/N^2=0 RMN/NlogN=0  
  4. Sort randomness N=10000 TimeSpared: 621ms  
  5. KCN=25721250 KCN/N=2572.13 KCN/N^2=0.257213 KCN/NlogN=193.572  
  6. RMN=29955 RMN/N=2.9955 RMN/N^2=0.00029955 RMN/NlogN=0.225434  
  7. Sort descending N=10000 TimeSpared: 0ms  
  8. KCN=9999 KCN/N=0.9999 KCN/N^2=9.999e-005 KCN/NlogN=0.07525  
  9. RMN=15000 RMN/N=1.5 RMN/N^2=0.00015 RMN/NlogN=0.112886  

  可以看到,确实减少了RMN,理论上RMNmax=3(n-1)。然而,就平均情况而言,性能还不如简单的直插——这是由于测试对象是整数的缘故。对于链表来说,这种方法就不需要***的重排了。关于重排的算法在严蔚敏的《数据结构(C语言版)》上有详细的说明。

【编辑推荐】

  1. 几种常用的C#排序方法简介
  2. 四种C#排序算法代码示例
  3. 介绍C#直接插入排序
  4. c++编程常用工具
  5. 给C++初学者的50个忠告
  6. c++最基础的20条规则
  7. 深入剖析C/C++程序员应聘常见面试题
  8. 程序员必看 c++笔试题汇总
责任编辑:韩亚珊 来源: 天极网
相关推荐

2011-04-11 14:52:18

选择排序排序C++

2011-04-11 14:21:43

希尔排序排序C++

2011-04-11 14:29:44

交换排序冒泡排序排序

2021-01-21 05:22:36

排序算法选择

2011-04-20 12:49:44

插入排序

2023-10-05 09:01:05

插入排序对象序列log2i

2011-04-11 15:53:40

C++

2009-08-03 17:45:04

C#直接插入排序

2023-10-04 18:23:02

插入排序算法

2023-10-07 00:11:37

希尔排序算法

2023-03-06 08:10:52

数据结构算法数据

2023-09-19 23:07:53

Python算法

2011-04-11 16:19:56

C++

2009-09-08 17:20:01

C#排序算法

2011-04-11 16:32:28

路径C++

2021-01-19 07:02:26

算法数据结构堆排序

2011-04-11 16:10:55

无向图C++

2011-04-11 15:57:22

DFSBFSC++

2011-04-11 16:43:51

AOVAOE活动网络

2023-04-03 07:33:05

数组排序快速排序法
点赞
收藏

51CTO技术栈公众号