各大排序算法比较
排序算法 |
时间复杂度(平均) |
时间复杂度(最差) |
时间复杂度(最好) |
空间复杂度 |
排序方式 |
稳定性 |
冒泡排序 |
O(n^2^) |
O(n^2^) |
O(n) |
O(1) |
比较排序 |
稳定 |
选择排序 |
O(n^2^) |
O(n^2^) |
O(n^2^) |
O(1) |
比较排序 |
不稳定 |
插入排序 |
O(n^2^) |
O(n^2^) |
O(n) |
O(1) |
比较排序 |
稳定 |
希尔排序 |
O(nlogn) |
O(n^2^) |
O(nlogn) |
O(1) |
比较排序 |
不稳定 |
归并排序 |
O(nlogn) |
O(nlogn) |
O(nlogn) |
O(n) |
比较排序 |
稳定 |
快速排序 |
O(nlogn) |
O(n^2^) |
O(nlogn) |
O(logn) |
比较排序 |
不稳定 |
堆排序 |
O(nlogn) |
O(nlogn) |
O(nlogn) |
O(1) |
比较排序 |
不稳定 |
术语解释:
内部排序:所有排序操作都在内存中完成,不需要额外的磁盘或其他存储设备的辅助。这适用于数据量小到足以完全加载到内存中的情况。
外部排序:当数据量过大,不可能全部加载到内存中时使用。外部排序通常涉及到数据的分区处理,部分数据被暂时存储在外部磁盘等存储设备上。
稳定:如果 A 原本在 B 前面,而 A=B,排序之后 A 仍然在 B 的前面。
不稳定:如果 A 原本在 B 的前面,而 A=B,排序之后 A 可能会出现在 B 的后面。
是否稳定决定于,相同的元素在排序后是否还能保持原有位置。
排序分类
比较类又被称为非线性时间排序,因为时间无法突破O(nlogn)
非比较类排序又被称为线性时间排序,可以达到O(n)
冒泡排序
重复遍历要排序序列,依次比较两个元素,一层一层往顶端方向缩短,越小的元素逐渐“浮”到尾端。
算法步骤
比较相邻的元素。如果第一个比第二个大,就交换它们两个;
对每一对相邻元素作同样的工作,从开始第一对到结尾的最后一对,这样在最后的元素应该会是最大的数;
然后向头部缩短一个位置,即排除当次遍历区间的最后一个数(已经确定);
重复步骤 1~3,直到排序完成。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26
|
public static int[] bubbleSort(int[] arr) { for (int i = 1; i < arr.length; i++) { boolean flag = true; for (int j = 0; j < arr.length - i; j++) { if (arr[j] > arr[j + 1]) { int tmp = arr[j]; arr[j] = arr[j + 1]; arr[j + 1] = tmp; flag = false; } } if (flag) { break; } } return arr; }
|
通过设置 flag ,可以使得最好时间达到 O(n)。
选择排序
首先在未排序序列中找到最小的元素,然后放到开头,
再继续从剩下的序列中找到最小的元素,放到开头的下一个,
如此重复。
算法步骤
- 首先在未排序序列中找到最小(大)元素,存放到排序序列的起始位置
- 再从剩余未排序元素中继续寻找最小(大)元素,然后放到已排序序列的末尾。
- 重复第 2 步,直到所有元素均排序完毕。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23
|
public static int[] selectionSort(int[] arr) { for (int i = 0; i < arr.length - 1; i++) { int minIndex = i; for (int j = i + 1; j < arr.length; j++) { if (arr[j] < arr[minIndex]) { minIndex = j; } } if (minIndex != i) { int tmp = arr[i]; arr[i] = arr[minIndex]; arr[minIndex] = tmp; } } return arr; }
|
为什么说选择排序不稳定?
以 [3a,7,6,5,3b,2]
为例:
当第一层找到最小元素 2 时,因为3a = 3b,本应该 3a 应该在前面,却被换到了 3b 后面。
插入排序
以第一个元素为基准,类似于扑克牌排序,将后面的数往大小往前面插入,当插好最后一张牌的时候就排好序了
算法步骤:
从第一个元素开始,该元素可以认为已经被排序;
取出下一个元素,在已经排序的元素序列中从后向前扫描;
如果该元素(已排序)大于新元素,将该元素移到下一位置,目的是空出位置;
重复步骤 3,直到找到已排序的元素小于或者等于新元素的位置;
将新元素插入到该位置后;
重复步骤 2~5。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
|
public static int[] insertionSort(int[] arr) { for (int i = 1; i < arr.length; i++) { int preIndex = i - 1; int current = arr[i]; while (preIndex >= 0 && current < arr[preIndex]) { arr[preIndex + 1] = arr[preIndex]; preIndex -= 1; } arr[preIndex + 1] = current; } return arr; }
|
最好时间为:O(n),当有序的时候,无需向前扫描。
希尔排序
其实就是给插入排序做了一个“预处理”。
将一个完整的序列分为 n 个增量间隔子序列,分别进行插入排序,最后增量变为 1,重新形成一个完整的序列。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
|
public static int[] shellSort(int[] arr) { int n = arr.length; int gap = n / 3; while (gap > 0) { for (int i = gap; i < n; i++) { int current = arr[i]; int preIndex = i - gap; while (preIndex >= 0 && arr[preIndex] > current) { arr[preIndex + gap] = arr[preIndex]; preIndex -= gap; } arr[preIndex + gap] = current;
} gap /= 3; } return arr; }
|
不稳定:相同的元素会破坏顺序
归并排序
将序列不断分为两半,直到单位为 1 时开始回溯,将子序列进行有序合并,最后形成一个完整的有序序列。
为保证有序合并,需单独创建一个 O(logn) 的空间。
算法步骤:
如果输入内只有一个元素,则直接返回,否则将序列一分为二;
分别对这两个子序列进行归并排序,使子序列变为有序状态;
设定两个指针,分别指向两个已经排序子序列的起始位置;
比较两个指针所指向的元素,选择相对小的元素放入到合并空间(用于存放排序结果),并移动指针到下一位置;
重复步骤 3 ~ 4 直到某一指针达到序列尾;
将另一序列剩下的所有元素直接复制到合并序列。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58
|
public static int[] mergeSort(int[] arr) { if (arr.length <= 1) { return arr; } int middle = arr.length / 2; int[] arr_1 = Arrays.copyOfRange(arr, 0, middle); int[] arr_2 = Arrays.copyOfRange(arr, middle, arr.length); return merge(mergeSort(arr_1), mergeSort(arr_2)); }
public static int[] merge(int[] arr_1, int[] arr_2) { int[] sorted_arr = new int[arr_1.length + arr_2.length]; int idx = 0, idx_1 = 0, idx_2 = 0; while (idx_1 < arr_1.length && idx_2 < arr_2.length) { if (arr_1[idx_1] <= arr_2[idx_2]) { sorted_arr[idx] = arr_1[idx_1]; idx_1 += 1; } else { sorted_arr[idx] = arr_2[idx_2]; idx_2 += 1; } idx += 1; } if (idx_1 < arr_1.length) { while (idx_1 < arr_1.length) { sorted_arr[idx] = arr_1[idx_1]; idx_1 += 1; idx += 1; } } else { while (idx_2 < arr_2.length) { sorted_arr[idx] = arr_2[idx_2]; idx_2 += 1; idx += 1; } } return sorted_arr; }
|
快速排序
和归并排序相似,区别是在分治的同时进行分区,
而前者是在回溯的时候借助额外空间返回有序序列。
先选定一个基准,根据基准分隔成两个部分(分区1 < 分区2),然后在基准的位置分裂进行分区。
只要保证每次分区左边的小于右边的,那么当分裂到 1 个时就排好序了。
算法步骤:
从序列中随机挑出一个元素,做为 “基准”(pivot
);
改变序列分布,将所有比基准值小的元素摆放在基准前面,所有比基准值大的摆在基准的后面(相同的数可以到任一边)。
操作结束之后,该基准就分割了两片区域(分区1 < 分区2)。
分别对两片区域继续进行递归分区。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30
| public static int partition(int[] array, int low, int high) { int pivot = array[high]; int pointer = low; for (int i = low; i < high; i++) { if (array[i] <= pivot) { int temp = array[i]; array[i] = array[pointer]; array[pointer] = temp; pointer++; } System.out.println(Arrays.toString(array)); } int temp = array[pointer]; array[pointer] = array[high]; array[high] = temp; return pointer; } public static void quickSort(int[] array, int low, int high) { if (low < high) { int position = partition(array, low, high); quickSort(array, low, position - 1); quickSort(array, position + 1, high); } }
|
最坏时间原因:当每次分治选取的基准值都是极值(max or min)时,时间等同于O(n^2^)
不稳定的原因:无相对位置的交换
- 分区元素交换
- 基准值位置交换
可能存在比基准值大的数,被交换到了尾部
如:[1,2,3,4,6a,7,8,6b,5]
在确定了左半区(<=5)时,需要移动 5 到分区位置,此时 6a 被交换到了原先 5 的位置
[1,2,3,4,5,7,8,6b,6a]
堆排序
关键在于建立大顶堆,将顶部和最后一个元素交换,再重新堆化,重复取出最大元素放在尾部,直到只剩一个元素即排序完成。
将初始待排序列 (R1,R2,…,Rn) 构建成大顶堆,此堆为初始的无序区;
将堆顶元素 R1 与最后一个元素 Rn 交换,此时得到新的无序区 (R1,R2,…,Rn−1) 和新的有序区 Rn, 且满足 Ri⩽Rn(i∈1,2,…,n−1);
由于交换后新的堆顶 R1 可能违反堆的性质,因此需要对当前无序区 (R1,R2,…,Rn−1) 调整为新堆,然后再次将 R1 与无序区最后一个元素交换,得到新的无序区 (R1,R2,…,Rn−2) 和新的有序区 (Rn−1,Rn)。不断重复此过程直到有序区的元素个数为 n−1,则整个排序过程完成。
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 56 57 58 59 60 61 62 63 64 65 66
|
private static void swap(int[] arr, int i, int j) { int tmp = arr[i]; arr[i] = arr[j]; arr[j] = tmp; }
private static void buildMaxHeap(int[] arr) { for (int i = arr.length / 2 - 1; i >= 0; i--) { heapify(arr, i); } }
private static void heapify(int[] arr, int i, int heapLen) { int left = 2 * i + 1; int right = 2 * i + 2; int largest = i; if (right < heapLen && arr[right] > arr[largest]) { largest = right; } if (left < heapLen && arr[left] > arr[largest]) { largest = left; } if (largest != i) { swap(arr, largest, i); heapify(arr, largest); } }
public static int[] heapSort(int[] arr) { int heapLen = arr.length; buildMaxHeap(arr); for (int i = arr.length - 1; i > 0; i--) { swap(arr, 0, i); heapLen -= 1; heapify(arr, 0, heapLen); } return arr; }
|
不稳定:因为在构建堆的时候比较最大值和相对位置无关,并且还有可能分在了不同子树上