双核CPU上的快速排序效率

开发 前端
为了试验一下多核CPU上排序算法的效率,得比较单任务情况下和多任务并行排序算法的差距,因此选用快速排序算法来进行比较。

为了试验一下多核CPU上排序算法的效率,得比较单任务情况下和多任务并行排序算法的差距,因此选用快速排序算法来进行比较。

测试环境:双核CPU 2.66GHZ

                    单核CPU 2.4GHZ

以下是一个快速排序算法的源代码:

  1. UINTSplit(void **ppData, UINTuStart, UINTuEnd, 
  2.                      COMPAREFUNCCompareFunc) 
  3.     void *pSelData; 
  4.     UINTuLow; 
  5.     UINTuHigh; 
  6.   
  7.     uLow = uStart
  8.     uHigh = uEnd
  9.   
  10.     pSelData = ppData[uLow]; 
  11.     while ( uLow < uHigh ) 
  12.     { 
  13.         while ( (*CompareFunc)(ppData[uHigh], pSelData) > 0 
  14.             && uLow != uHigh ) 
  15.         { 
  16.             --uHigh; 
  17.         } 
  18.         if ( uHigh != uLow ) 
  19.         { 
  20.             ppData[uLow] = ppData[uHigh]; 
  21.             ++uLow; 
  22.         } 
  23.   
  24.         while ( (*CompareFunc)( ppData[uLow], pSelData ) < 0 
  25.             && uLow != uHigh ) 
  26.         { 
  27.              ++uLow; 
  28.         } 
  29.         if ( uLow != uHigh ) 
  30.         { 
  31.             ppData[uHigh] = ppData[uLow]; 
  32.             --uHigh; 
  33.         } 
  34.     } 
  35.     ppData[uLow] = pSelData; 
  36.   
  37.     returnuLow; 
  38.   
  39.   
  40. voidQuickSort(void **ppData, UINTuStart, UINTuEnd, 
  41.                         COMPAREFUNCCompareFunc) 
  42.     UINTuMid = Split(ppData, uStart, uEnd, CompareFunc ); 
  43.     if ( uMid > uStart ) 
  44.     { 
  45.         QuickSort(ppData, uStart, uMid - 1, CompareFunc); 
  46.     } 
  47.   
  48.     if ( uEnd > uMid ) 
  49.     { 
  50.         QuickSort(ppData, uMid + 1, uEnd, CompareFunc); 
  51.    } 

先测试一下这个快速排序算法排一百万个随机整数所花的时间:

  1. voidTest_QuickSort(void) 
  2.     UINTi; 
  3.     UINTuCount = 1000000; //1000000个 
  4.   
  5.     srand(time(NULL)); 
  6.     void **pp = (void **)malloc(uCount * sizeof(void *)); 
  7.     for ( i = 0; i < uCount; i++ ) 
  8.     { 
  9.         pp[i] = (void *)(rand() % uCount); 
  10.     } 
  11.   
  12.        clockclock_tt1 = clock(); 
  13.     QuickSort(pp, 0, uCount-1, UIntCompare); 
  14.        clockclock_tt2 = clock(); 
  15.   
  16.        printf("QuickSort 1000000 Time %ld/n", t2-t1); 
  17.   
  18.     free(pp); 

在双核CPU2.66GHZ机器上运行测试程序,打印出花费的时间约为406 ms

在单核CPU2.4GHZ机器上运行测试程序,打印出花费时间约为484ms

可见在双核CPU上运行单任务程序和单核CPU基本是一样的,效率没有任何提高。

下面再来把上面的快速排序程序变成并行的,一个简单的方法就是将要排序的区间分成相同的几个段,然后对每个段进行快速排序,排序完后再使用归并算法将排好的几个区间归并成一个排好序的表,我们先四个线程来进行排序,代码如下:

  1. void ** Merge(void **ppData, UINTuStart, UINTuEnd, 
  2.        void **ppData2, UINTuStart2, UINTuEnd2, COMPAREFUNCcfunc) 
  3.     UINTi, j, k; 
  4.     UINTu1, u2, v1,v2; 
  5.     void **pp1; 
  6.     void **pp2; 
  7.   
  8.     void **pp = (void **)malloc( (uEnd-uStart+1+uEnd2-uStart2+1) * sizeof(void *)); 
  9.     if ( pp == NULL ) 
  10.     { 
  11.         returnNULL; 
  12.     } 
  13.   
  14.     if ( (*cfunc)(ppData2[uStart2], ppData[uStart]) > 0 ) 
  15.     { 
  16.         u1 = uStart
  17.         u2 = uEnd
  18.         v1 = uStart2
  19.         v2 = uEnd2
  20.         pp1 = ppData
  21.         pp2 = ppData2
  22.     } 
  23.     else 
  24.     {        
  25.         u1 = uStart2
  26.         u2 = uEnd2
  27.         v1 = uStart
  28.         v2 = uEnd
  29.         pp1 = ppData2
  30.         pp2 = ppData
  31.     } 
  32.   
  33.     k = 0
  34.     pp[k] = pp1[u1]; 
  35.     j = v1
  36.     for (i = u1+1; i <= u2; i++ ) 
  37.     { 
  38.         while ( j <= v2 ) 
  39.         { 
  40.             if ( (*cfunc)(pp2[j], pp1[i]) < 0 ) 
  41.            { 
  42.                 ++k; 
  43.                 pp[k] = pp2[j]; 
  44.                 j++; 
  45.             } 
  46.             else 
  47.             { 
  48.                 break; 
  49.             } 
  50.         } 
  51.         ++k; 
  52.         pp[k] = pp1[i]; 
  53.     } 
  54.   
  55.     if ( j < v2 ) 
  56.     { 
  57.         for ( i = j; i <= v2; i++) 
  58.         { 
  59.             ++k; 
  60.             pp[k] = pp2[i]; 
  61.         } 
  62.     } 
  63.     returnpp; 
  64.   
  65. typedefstructSORTNODE_st { 
  66.        void **           ppData; 
  67.        UINT             uStart; 
  68.        UINT             uEnd; 
  69.        COMPAREFUNCfunc; 
  70. } SORTNODE; 
  71.   
  72.   
  73. DWORDWINAPIQuickSort_Thread(void *arg) 
  74.        SORTNODE   *pNode = (SORTNODE *)arg; 
  75.        QuickSort(pNode->ppData, pNode->uStart, pNode->uEnd, pNode->func); 
  76.        return 1; 
  77.   
  78. #define THREAD_COUNT    4 
  79.   
  80. INTMQuickSort(void **ppData, UINTuStart, UINTuEnd, 
  81. COMPAREFUNCCompareFunc) 
  82.     void **pp1; 
  83.     void **pp2; 
  84.     void **pp3; 
  85.        INT               i; 
  86.        SORTNODE   Node[THREAD_COUNT]; 
  87.        HANDLE        hThread[THREAD_COUNT]; 
  88.   
  89.        INT        nRet = CAPI_FAILED
  90.   
  91.        for ( i = 0; i < THREAD_COUNT; i++) 
  92.        { 
  93.               Node[i].ppData = ppData; 
  94.               if ( i == 0 ) 
  95.               { 
  96.                      Node[i].uStart = uStart; 
  97.               } 
  98.               else 
  99.               { 
  100.                      Node[i].uStart = uEnd * i /THREAD_COUNT + 1;  
  101.               } 
  102.               Node[i].uEnd = uEnd *(i+1) / THREAD_COUNT; 
  103.               Node[i].func = CompareFunc
  104.   
  105.               hThread[i] = CreateThread(NULL, 0, QuickSort_Thread, &(Node[i]), 0, NULL); 
  106.        } 
  107.   
  108.        for ( i = 0; i < THREAD_COUNT; i++ ) 
  109.        { 
  110.               WaitForSingleObject(hThread[i], INFINITE); 
  111.        } 
  112.   
  113.   
  114.     pp1 = Merge(ppData, uStart, uEnd/4, ppData, uEnd/4+1, uEnd/2, CompareFunc); 
  115.   
  116.     pp2 = Merge(ppData, uEnd/2+1, uEnd*3/4, ppData, uEnd*3/4+1, uEnd, CompareFunc); 
  117.   
  118.     if ( pp1 != NULL && pp2 != NULL ) 
  119.     { 
  120.         pp3 = Merge(pp1, 0, uEnd/2-uStart, pp2, 0, uEnd - uEnd/2 - 1, CompareFunc); 
  121.   
  122.         if ( pp3 != NULL ) 
  123.         { 
  124.             UINTi; 
  125.           
  126.             for ( i = uStart; i <= uEnd; i++) 
  127.             { 
  128.                 ppData[i] = pp3[i-uStart]; 
  129.             } 
  130.             free(pp3); 
  131.             nRet = CAPI_SUCCESS
  132.         } 
  133.     } 
  134.     if( pp1 != NULL) 
  135.     { 
  136.         free( pp1 ); 
  137.     } 
  138.     if ( pp2 != NULL ) 
  139.     { 
  140.         free( pp2 ); 
  141.     } 
  142.   
  143.     returnnRet; 

#p#

用下面程序来测试一下排1百万个随机整数的花费时间:

  1. voidTest_MQuickSort (void) 
  2.     UINTi; 
  3.     UINTuCount = 1000000; //1000个 
  4.   
  5.     srand(time(NULL)); 
  6.     void **pp = (void **)malloc(uCount * sizeof(void *)); 
  7.     for ( i = 0; i < uCount; i++ ) 
  8.     { 
  9.         pp[i] = (void *)(rand() % uCount); 
  10.     } 
  11.   
  12.        clockclock_tt1 = clock(); 
  13.     INTnRet = MQuickSort(pp, 0, uCount-1, UIntCompare); 
  14.        clockclock_tt2 = clock(); 
  15.   
  16.        printf("MQuickSort 1000000 Time %ld/n", t2-t1); 
  17.   
  18.     free(pp); 

在双核CPU上运行后,打印出花费的时间为 234 ms , 单任务版的快速排序函数约需406ms左右,并行运行效率为:406/(2×234) = 86.7% 左右。运行速度快了172ms。

可见双核CPU中,多任务程序速度还是有很大提高的。

当然上面的多任务版的快速排序程序还有很大的改进余地,当对4个区间排好序后,后面的归并操作都是在一个任务里运行的,对整体效率会产生影响。估计将程序继续优化后,速度还能再快一些。

原文链接:http://blog.csdn.net/drzhouweiming/article/details/1109499

责任编辑:陈四芳 来源: blog.csdn.net
相关推荐

2009-04-18 14:52:54

双核四核服务器

2010-04-26 16:51:04

Power 5

2011-08-16 17:05:35

2014-03-03 16:44:57

算法

2011-01-18 09:20:49

Linux嵌入式

2011-05-07 16:09:55

上网本华硕EeePC 101

2012-02-13 13:37:01

激光打印机评测

2012-03-28 22:29:28

手机

2023-07-10 13:46:58

PythonLlama.cppLLM

2009-03-24 10:53:09

Nehalem四核

2012-09-07 14:42:20

2012-02-01 17:28:34

戴尔笔记本

2013-12-16 16:49:57

OpenMP

2009-07-28 19:28:37

四核CPU多核

2009-09-04 11:26:00

英特尔虚拟化

2012-05-21 18:13:42

360特供机

2020-07-21 09:05:47

CPU1号核寄存器

2009-03-24 13:55:46

四核双核服务器

2011-04-28 10:35:51

上网本东芝REGZA Table
点赞
收藏

51CTO技术栈公众号