NO IMAGE
目錄

0、排序演算法說明

0.1 排序的定義

對一序列物件根據某個關鍵字進行排序。

0.2 術語說明

  • 穩定:如果a原本在b前面,而a=b,排序之後a仍然在b的前面;
  • 不穩定:如果a原本在b的前面,而a=b,排序之後a可能會出現在b的後面;
  • 內排序:所有排序操作都在記憶體中完成;
  • 外排序:由於資料太大,因此把資料放在磁碟中,而排序通過磁碟和記憶體的資料傳輸才能進行;
  • 時間複雜度: 一個演算法執行所耗費的時間。
  • 空間複雜度:執行完一個程式所需記憶體的大小。

0.3 演算法總結

圖片名詞解釋:

  • n: 資料規模
  • k: “桶”的個數
  • In-place: 佔用常數記憶體,不佔用額外記憶體
  • Out-place: 佔用額外記憶體

0.5 演算法分類

1、氣泡排序(Bubble Sort)

氣泡排序是一種簡單的排序演算法。它重複地走訪過要排序的數列,一次比較兩個元素,如果它們的順序錯誤就把它們交換過來。走訪數列的工作是重複地進行直到沒有再需要交換,也就是說該數列已經排序完成。這個演算法的名字由來是因為越小的元素會經由交換慢慢“浮”到數列的頂端。 

1.1 演算法描述

  • 比較相鄰的元素。如果第一個比第二個大,就交換它們兩個;
  • 對每一對相鄰元素作同樣的工作,從開始第一對到結尾的最後一對,這樣在最後的元素應該會是最大的數;
  • 針對所有的元素重複以上的步驟,除了最後一個;
  • 重複步驟1~3,直到排序完成。

1.2 動圖演示

1.3 程式碼實現

1
2
3
4
5
6
7
8
9
10
11
12
13
function bubbleSort(arr) {
    var len = arr.length;
    for (var i = 0; i < len; i ) {
        for (var j = 0; j < len - 1 - i; j ) {
            if (arr[j] > arr[j 1]) {       //相鄰元素兩兩對比
                var temp = arr[j 1];       //元素交換
                arr[j 1] = arr[j];
                arr[j] = temp;
            }
        }
    }
    return arr;
}

1.4 演算法分析

最佳情況:T(n) = O(n)   最差情況:T(n) = O(n2)   平均情況:T(n) = O(n2)

2、選擇排序(Selection Sort)

表現最穩定的排序演算法之一,因為無論什麼資料進去都是O(n2)的時間複雜度,所以用到它的時候,資料規模越小越好。唯一的好處可能就是不佔用額外的記憶體空間了吧。理論上講,選擇排序可能也是平時排序一般人想到的最多的排序方法了吧。

選擇排序(Selection-sort)是一種簡單直觀的排序演算法。它的工作原理:首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置,然後,再從剩餘未排序元素中繼續尋找最小(大)元素,然後放到已排序序列的末尾。以此類推,直到所有元素均排序完畢。 

2.1 演算法描述

n個記錄的直接選擇排序可經過n-1趟直接選擇排序得到有序結果。具體演算法描述如下:

  • 初始狀態:無序區為R[1..n],有序區為空;
  • 第i趟排序(i=1,2,3…n-1)開始時,當前有序區和無序區分別為R[1..i-1]和R(i..n)。該趟排序從當前無序區中-選出關鍵字最小的記錄 R[k],將它與無序區的第1個記錄R交換,使R[1..i]和R[i 1..n)分別變為記錄個數增加1個的新有序區和記錄個數減少1個的新無序區;
  • n-1趟結束,陣列有序化了。

2.2 動圖演示

  

2.3 程式碼實現

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
function selectionSort(arr) {
    var len = arr.length;
    var minIndex, temp;
    for (var i = 0; i < len - 1; i ) {
        minIndex = i;
        for (var j = i 1; j < len; j ) {
            if (arr[j] < arr[minIndex]) {    //尋找最小的數
                minIndex = j;                //將最小數的索引儲存
            }
        }
        temp = arr[i];
        arr[i] = arr[minIndex];
        arr[minIndex] = temp;
    }
    return arr;
}

2.4 演算法分析

最佳情況:T(n) = O(n2)  最差情況:T(n) = O(n2)  平均情況:T(n) = O(n2)

3、插入排序(Insertion Sort)

插入排序(Insertion-Sort)的演算法描述是一種簡單直觀的排序演算法。它的工作原理是通過構建有序序列,對於未排序資料,在已排序序列中從後向前掃描,找到相應位置並插入。插入排序在實現上,通常採用in-place排序(即只需用到O(1)的額外空間的排序),因而在從後向前掃描過程中,需要反覆把已排序元素逐步向後挪位,為最新元素提供插入空間。

3.1 演算法描述

一般來說,插入排序都採用in-place在陣列上實現。具體演算法描述如下:

  • 從第一個元素開始,該元素可以認為已經被排序;
  • 取出下一個元素,在已經排序的元素序列中從後向前掃描;
  • 如果該元素(已排序)大於新元素,將該元素移到下一位置;
  • 重複步驟3,直到找到已排序的元素小於或者等於新元素的位置;
  • 將新元素插入到該位置後;
  • 重複步驟2~5。

3.2 動圖演示

3.2 程式碼實現

1
2
3
4
5
6
7
8
9
10
11
12
13
14
function insertionSort(arr) {
    var len = arr.length;
    var preIndex, current;
    for (var i = 1; i < len; i ) {
        preIndex = i - 1;
        current = arr[i];
        while(preIndex >= 0 && arr[preIndex] > current) {
            arr[preIndex 1] = arr[preIndex];
            preIndex--;
        }
        arr[preIndex 1] = current;
    }
    return arr;
}

3.4 演算法分析

最佳情況:T(n) = O(n)   最壞情況:T(n) = O(n2)   平均情況:T(n) = O(n2)

4、希爾排序(Shell Sort)

1959年Shell發明,第一個突破O(n^2)的排序演算法,是簡單插入排序的改進版。它與插入排序的不同之處在於,它會優先比較距離較遠的元素。希爾排序又叫縮小增量排序。

希爾排序的核心在於間隔序列的設定。既可以提前設定好間隔序列,也可以動態的定義間隔序列。動態定義間隔序列的演算法是《演算法(第4版》的合著者Robert Sedgewick提出的。 

4.1 演算法描述

先將整個待排序的記錄序列分割成為若干子序列分別進行直接插入排序,具體演算法描述:

  • 選擇一個增量序列t1,t2,…,tk,其中ti>tj,tk=1;
  • 按增量序列個數k,對序列進行k 趟排序;
  • 每趟排序,根據對應的增量ti,將待排序列分割成若干長度為m 的子序列,分別對各子表進行直接插入排序。僅增量因子為1 時,整個序列作為一個表來處理,表長度即為整個序列的長度。

4.2 過程演示

4.3 程式碼實現

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
function shellSort(arr) {
    var len = arr.length,
        temp,
        gap = 1;
    while(gap < len/3) {         //動態定義間隔序列
        gap =gap*3 1;
    }
    for (gap; gap> 0; gap = Math.floor(gap/3)) {
        for (var i = gap; i < len; i ) {
            temp = arr[i];
            for (var j = i-gap; j > 0 && arr[j]> temp; j-=gap) {
                arr[j gap] = arr[j];
            }
            arr[j gap] = temp;
        }
    }
    return arr;
}

4.4 演算法分析

最佳情況:T(n) = O(nlog2 n)  最壞情況:T(n) = O(nlog2 n)  平均情況:T(n) =O(nlog n) 

5、歸併排序(Merge Sort)

和選擇排序一樣,歸併排序的效能不受輸入資料的影響,但表現比選擇排序好的多,因為始終都是O(n log n)的時間複雜度。代價是需要額外的記憶體空間。

歸併排序是建立在歸併操作上的一種有效的排序演算法。該演算法是採用分治法(Divide and Conquer)的一個非常典型的應用。歸併排序是一種穩定的排序方法。將已有序的子序列合併,得到完全有序的序列;即先使每個子序列有序,再使子序列段間有序。若將兩個有序表合併成一個有序表,稱為2-路歸併。 

5.1 演算法描述

  • 把長度為n的輸入序列分成兩個長度為n/2的子序列;
  • 對這兩個子序列分別採用歸併排序;
  • 將兩個排序好的子序列合併成一個最終的排序序列。

5.2 動圖演示

5.3 程式碼實現

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
function mergeSort(arr) { //採用自上而下的遞迴方法
    var len = arr.length;
    if(len < 2) {
        return arr;
    }
    var middle = Math.floor(len / 2),
        left = arr.slice(0, middle),
        right = arr.slice(middle);
    return merge(mergeSort(left), mergeSort(right));
}
 
function merge(left, right)
{
    var result = [];
 
    while (left.length>0 && right.length>0) {
        if (left[0] <= right[0]) {
            result.push(left.shift());
        }else {
            result.push(right.shift());
        }
    }
 
    while (left.length)
        result.push(left.shift());
 
    while (right.length)
        result.push(right.shift());
 
    return result;
}

5. 4 演算法分析

最佳情況:T(n) = O(n)  最差情況:T(n) = O(nlogn)  平均情況:T(n) = O(nlogn)

6、快速排序(Quick Sort)

快速排序的基本思想:通過一趟排序將待排記錄分隔成獨立的兩部分,其中一部分記錄的關鍵字均比另一部分的關鍵字小,則可分別對這兩部分記錄繼續進行排序,以達到整個序列有序。

6.1 演算法描述

快速排序使用分治法來把一個串(list)分為兩個子串(sub-lists)。具體演算法描述如下:

  • 從數列中挑出一個元素,稱為 “基準”(pivot);
  • 重新排序數列,所有元素比基準值小的擺放在基準前面,所有元素比基準值大的擺在基準的後面(相同的數可以到任一邊)。在這個分割槽退出之後,該基準就處於數列的中間位置。這個稱為分割槽(partition)操作;
  • 遞迴地(recursive)把小於基準值元素的子數列和大於基準值元素的子數列排序。

5.2 動圖演示

5.3 程式碼實現

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
function quickSort(arr, left, right) {
    var len = arr.length,
        partitionIndex,
        left =typeof left !='number' ? 0 : left,
        right =typeof right !='number' ? len - 1 : right;
 
    if (left < right) {
        partitionIndex = partition(arr, left, right);
        quickSort(arr, left, partitionIndex-1);
        quickSort(arr, partitionIndex 1, right);
    }
    return arr;
}
 
function partition(arr, left ,right) {    //分割槽操作
    var pivot = left,                     //設定基準值(pivot)
        index = pivot 1;
    for (var i = index; i <= right; i ) {
        if (arr[i] < arr[pivot]) {
            swap(arr, i, index);
            index ;
        }       
    }
    swap(arr, pivot, index - 1);
    return index-1;
}
 
function swap(arr, i, j) {
    var temp = arr[i];
    arr[i] = arr[j];
    arr[j] = temp;
}

5.4 演算法分析

最佳情況:T(n) = O(nlogn)   最差情況:T(n) = O(n2)   平均情況:T(n) = O(nlogn) 

7、堆排序(Heap Sort)

堆排序(Heapsort)是指利用堆這種資料結構所設計的一種排序演算法。堆積是一個近似完全二叉樹的結構,並同時滿足堆積的性質:即子結點的鍵值或索引總是小於(或者大於)它的父節點。

7.1 演算法描述

  • 將初始待排序關鍵字序列(R1,R2….Rn)構建成大頂堆,此堆為初始的無序區;
  • 將堆頂元素R[1]與最後一個元素R[n]交換,此時得到新的無序區(R1,R2,……Rn-1)和新的有序區(Rn),且滿足R[1,2…n-1]<=R[n];
  • 由於交換後新的堆頂R[1]可能違反堆的性質,因此需要對當前無序區(R1,R2,……Rn-1)調整為新堆,然後再次將R[1]與無序區最後一個元素交換,得到新的無序區(R1,R2….Rn-2)和新的有序區(Rn-1,Rn)。不斷重複此過程直到有序區的元素個數為n-1,則整個排序過程完成。

7.2 動圖演示

7.3 程式碼實現

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
var len;   //因為宣告的多個函式都需要資料長度,所以把len設定成為全域性變數
 
function buildMaxHeap(arr) {  //建立大頂堆
    len = arr.length;
    for (var i = Math.floor(len/2); i >= 0; i--) {
        heapify(arr, i);
    }
}
 
function heapify(arr, i) {    //堆調整
    var left = 2 * i 1,
        right = 2 * i 2,
        largest = i;
 
    if (left < len && arr[left] > arr[largest]) {
        largest = left;
    }
 
    if (right < len && arr[right] > arr[largest]) {
        largest = right;
    }
 
    if (largest != i) {
        swap(arr, i, largest);
        heapify(arr, largest);
    }
}
 
function swap(arr, i, j) {
    var temp = arr[i];
    arr[i] = arr[j];
    arr[j] = temp;
}
 
function heapSort(arr) {
    buildMaxHeap(arr);
 
    for (var i = arr.length-1; i > 0; i--) {
        swap(arr, 0, i);
        len--;
        heapify(arr, 0);
    }
    return arr;
}

7.4 演算法分析

最佳情況:T(n) = O(nlogn) 最差情況:T(n) = O(nlogn) 平均情況:T(n) = O(nlogn)

8、計數排序(Counting Sort)

計數排序的核心在於將輸入的資料值轉化為鍵儲存在額外開闢的陣列空間中。 作為一種線性時間複雜度的排序,計數排序要求輸入的資料必須是有確定範圍的整數。

計數排序(Counting sort)是一種穩定的排序演算法。計數排序使用一個額外的陣列C,其中第i個元素是待排序陣列A中值等於i的元素的個數。然後根據陣列C來將A中的元素排到正確的位置。它只能對整數進行排序。

8.1 演算法描述

  • 找出待排序的陣列中最大和最小的元素;
  • 統計陣列中每個值為i的元素出現的次數,存入陣列C的第i項;
  • 對所有的計數累加(從C中的第一個元素開始,每一項和前一項相加);
  • 反向填充目標陣列:將每個元素i放在新陣列的第C(i)項,每放一個元素就將C(i)減去1。

8.2 動圖演示

8.3 程式碼實現

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
function countingSort(arr, maxValue) {
    var bucket =new Array(maxValue 1),
        sortedIndex = 0;
        arrLen = arr.length,
        bucketLen = maxValue 1;
 
    for (var i = 0; i < arrLen; i ) {
        if (!bucket[arr[i]]) {
            bucket[arr[i]] = 0;
        }
        bucket[arr[i]] ;
    }
 
    for (var j = 0; j < bucketLen; j ) {
        while(bucket[j] > 0) {
            arr[sortedIndex ] = j;
            bucket[j]--;
        }
    }
 
    return arr;
}

8.4 演算法分析

當輸入的元素是n 個0到k之間的整數時,它的執行時間是 O(n k)。計數排序不是比較排序,排序的速度快於任何比較排序演算法。由於用來計數的陣列C的長度取決於待排序陣列中資料的範圍(等於待排序陣列的最大值與最小值的差加上1),這使得計數排序對於資料範圍很大的陣列,需要大量時間和記憶體。

最佳情況:T(n) = O(n k)  最差情況:T(n) = O(n k)  平均情況:T(n) = O(n k)

9、桶排序(Bucket Sort)

桶排序是計數排序的升級版。它利用了函式的對映關係,高效與否的關鍵就在於這個對映函式的確定。

桶排序 (Bucket sort)的工作的原理:假設輸入資料服從均勻分佈,將資料分到有限數量的桶裡,每個桶再分別排序(有可能再使用別的排序演算法或是以遞迴方式繼續使用桶排序進行排

9.1 演算法描述

  • 設定一個定量的陣列當作空桶;
  • 遍歷輸入資料,並且把資料一個一個放到對應的桶裡去;
  • 對每個不是空的桶進行排序;
  • 從不是空的桶裡把排好序的資料拼接起來。 

9.2 圖片演示

9.3 程式碼實現

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
function bucketSort(arr, bucketSize) {
    if (arr.length === 0) {
      return arr;
    }
 
    var i;
    var minValue = arr[0];
    var maxValue = arr[0];
    for (i = 1; i < arr.length; i ) {
      if (arr[i] < minValue) {
          minValue = arr[i];               //輸入資料的最小值
      }else if (arr[i] > maxValue) {
          maxValue = arr[i];               //輸入資料的最大值
      }
    }
 
    //桶的初始化
    var DEFAULT_BUCKET_SIZE = 5;           //設定桶的預設數量為5
    bucketSize = bucketSize || DEFAULT_BUCKET_SIZE;
    var bucketCount = Math.floor((maxValue - minValue) / bucketSize) 1;  
    var buckets =new Array(bucketCount);
    for (i = 0; i < buckets.length; i ) {
        buckets[i] = [];
    }
 
    //利用對映函式將資料分配到各個桶中
    for (i = 0; i < arr.length; i ) {
        buckets[Math.floor((arr[i] - minValue) / bucketSize)].push(arr[i]);
    }
 
    arr.length = 0;
    for (i = 0; i < buckets.length; i ) {
        insertionSort(buckets[i]);                     //對每個桶進行排序,這裡使用了插入排序
        for (var j = 0; j < buckets[i].length; j ) {
            arr.push(buckets[i][j]);                     
        }
    }
 
    return arr;
}

9.4 演算法分析

桶排序最好情況下使用線性時間O(n),桶排序的時間複雜度,取決與對各個桶之間資料進行排序的時間複雜度,因為其它部分的時間複雜度都為O(n)。很顯然,桶劃分的越小,各個桶之間的資料越少,排序所用的時間也會越少。但相應的空間消耗就會增大。 

最佳情況:T(n) = O(n k)   最差情況:T(n) = O(n k)   平均情況:T(n) = O(n2)  

10、基數排序(Radix Sort)

基數排序也是非比較的排序演算法,對每一位進行排序,從最低位開始排序,複雜度為O(kn),為陣列長度,k為陣列中的數的最大的位數;

基數排序是按照低位先排序,然後收集;再按照高位排序,然後再收集;依次類推,直到最高位。有時候有些屬性是有優先順序順序的,先按低優先順序排序,再按高優先順序排序。最後的次序就是高優先順序高的在前,高優先順序相同的低優先順序高的在前。基數排序基於分別排序,分別收集,所以是穩定的。

10.1 演算法描述

  • 取得陣列中的最大數,並取得位數;
  • arr為原始陣列,從最低位開始取每個位組成radix陣列;
  • 對radix進行計數排序(利用計數排序適用於小範圍數的特點);

10.2 動圖演示

 

10.3 程式碼實現

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
//LSD Radix Sort
var counter = [];
function radixSort(arr, maxDigit) {
    var mod = 10;
    var dev = 1;
    for (var i = 0; i < maxDigit; i , dev *= 10, mod *= 10) {
        for(var j = 0; j < arr.length; j ) {
            var bucket = parseInt((arr[j] % mod) / dev);
            if(counter[bucket]==null) {
                counter[bucket] = [];
            }
            counter[bucket].push(arr[j]);
        }
        var pos = 0;
        for(var j = 0; j < counter.length; j ) {
            var value =null;
            if(counter[j]!=null) {
                while ((value = counter[j].shift()) !=null) {
                      arr[pos ] = value;
                }
          }
        }
    }
    return arr;
}

10.4 演算法分析

最佳情況:T(n) = O(n * k)   最差情況:T(n) = O(n * k)   平均情況:T(n) = O(n * k)

基數排序有兩種方法:

MSD 從高位開始進行排序 LSD 從低位開始進行排序 

 

基數排序 vs 計數排序 vs 桶排序

這三種排序演算法都利用了桶的概念,但對桶的使用方法上有明顯差異:

  • 基數排序:根據鍵值的每位數字來分配桶
  • 計數排序:每個桶只儲存單一鍵值
  • 桶排序:每個桶儲存一定範圍的數值

 

 

參考資料:

http://blog.csdn.net/fengyinchao/article/details/52667625