Java 【数据结构】常见排序算法实用详解(下) 冒泡排序/快速排序/归并排序/非基于比较排序【贤者的庇护】

中草药z 2024-06-15 10:05:02 阅读 76

 登神长阶

上古神器-常见排序算法

冒泡排序/快速排序/归并排序/非基于比较排序


💰一.前言

        为保障知识获取的可读性,以及连贯性,再开始可以适当的重新温习前文内容 :Java 【数据结构】常见排序算法实用详解(上) 插入排序/希尔排序/选择排序/堆排序【贤者的庇护】

        在本篇内容我们将紧跟前篇内容,进一步学习冒泡排序,快速排序,归并排序以及非基于比较排序。 

🪙二.冒泡排序

基本原理

冒泡排序是一种简单直观的排序算法,它重复地遍历要排序的列表,一次比较两个元素,并且如果它们的顺序错误就将它们交换位置。这个过程持续到列表没有任何再次交换的元素为止。

算法步骤

从列表的第一个元素开始,依次比较相邻的两个元素。如果顺序不正确(例如,前面的元素大于后面的元素),则交换这两个元素。继续对每一对相邻元素进行相同的操作,直到到达列表的末尾。重复以上步骤,每次都从列表的开始处进行,直到没有任何元素需要交换。

时间复杂度

冒泡排序的时间复杂度为O(n^2),其中n是列表的长度。这是因为在最坏情况下,需要进行n-1轮比较,每一轮最多进行n-1次交换。

稳定性

冒泡排序是稳定的排序算法。在排序过程中,相同元素的相对位置不会发生变化,只有在相邻元素大小不同时才进行交换。

适用性

冒泡排序是一个简单但效率较低的排序算法,通常用于教学目的或者在数据集较小时。由于其时间复杂度较高,在大型数据集上性能不佳,不适合实际应用。然而,由于其实现简单,易于理解和实现,有时在一些特殊场景下可能会被采用。

源代码

/** * 冒泡排序 * 时间复杂度: * 不管数据 有序 还是无序 在不优化的情况下:O(N^2) 5 4 3 2 1 * 空间复杂度:O(1) * 稳定性:稳定 * 目前学到现在为止:2个稳定排序 ,插入排序 冒泡排序 * @param arr */ public static void bubbleSort(int[] arr){ for (int i = 0; i < arr.length-1; i++) { boolean flag=false; for (int j = 0; j < arr.length-i-1; j++) { if (arr[j]>arr[j+1]){ swap(arr,j,j+1); flag=true; } } //在优化了的情况下,当数据有序,1 2 3 4 5 //时间复杂度为:O(N) if (flag==false){ break; } } }

💴三.快速排序

基本原理

快速排序是一种基于分治思想的排序算法。它的基本思想是选择一个基准元素,然后将数组分割成两个子数组,一个子数组中的所有元素都比基准元素小,另一个子数组中的所有元素都比基准元素大。然后递归地对这两个子数组进行排序。

算法步骤

选择一个基准元素(通常是数组中的第一个元素)。将数组分割成两个子数组,一个子数组中的元素都比基准元素小,另一个子数组中的元素都比基准元素大。递归地对两个子数组进行排序。将两个排序好的子数组合并起来。

时间复杂度

快速排序的平均时间复杂度为O(n log n),其中n是数组的长度。最坏情况下的时间复杂度是O(n^2),当数组已经有序或者基准元素选择不当时会发生。然而,由于快速排序通常表现良好,因此平均时间复杂度更具代表性。

稳定性

快速排序是不稳定的排序算法。在排序过程中,相同元素的相对位置可能会发生变化。

适用性

快速排序在大多数情况下表现良好,并且通常被认为是最快的排序算法之一(因此得名)。它特别适用于大型数据集的排序,因为其平均时间复杂度相对较低。然而,由于其不稳定性和最坏情况下的性能可能较差,有时可能不适用于特定情况,例如需要稳定排序的场景。

源代码 

 

/** * 快速排序 * 时间复杂度:O(N*logN) * 空间复杂度:O(logN) * 稳定性:不稳定 * @param array */public static void quickSort(int arr[]){//保证接口的统一性 quick(arr,0,arr.length-1); } public static void quick(int[] arr,int start,int end){ if (start>=end){ return; } //寻找基准元素 int par=partition(arr,start,end); quick(arr,start,par-1); quick(arr,par+1,end); }

 在上述代码之中, int par=partition(arr,start,end);有多种方法,在这里我们展开说明三种:

1.挖坑法

/** * 挖坑法 * @param arr * @param left * @param right * @return */ public static int partitionDig(int[] arr,int left,int right){ int temp=arr[left]; while(left<right){ while(left<right&&arr[right]>=temp){ right--; } arr[left]=arr[right]; while(left<right&&arr[left]<=temp){ left++; } arr[right]=arr[left]; } arr[left]=temp; return left; }

2.Hoare法

/** * Hoare法 * @param arr * @param left * @param right * @return */ public static int partitionHoare(int[] arr,int left,int right){ int i=left; int temp=arr[left]; while(left<right){ while(left<right&&arr[right]>=temp){ right--; } while(left<right&&arr[left]<=temp){ left++; } swap(arr,left,right); } swap(arr,left,i); return left; }

3.前后指针法 

/** * 前后指针法 * @param arr * @param left * @param right * @return */ public static int partitionPrev(int[] arr,int left,int right){ int prev=left; int cur=left+1; while(cur<=right){ if (arr[cur]<arr[left]&&arr[++prev]!=arr[cur]){ swap(arr,cur,prev); } } swap(arr,left,prev); return prev; }

同时由于当数据很少,且基本趋于有序的情况而言,我们对此代码进行优化

/** * 快速排序 优化 * 时间复杂度:O(N*logN) * 空间复杂度:O(logN) * 稳定性:不稳定 * @param array */ public static void quickSort(int arr[]){ quick(arr,0,arr.length-1); } public static void quick(int[] arr,int start,int end){ if (start>=end){ return; } //优化 if(end - start + 1 <= 10) { //插入排序 insertSortRange(arr,start,end); return; } //三数取中 int index = midThreeNum(arr,start,end); swap(arr,index,start); //寻找基准元素 int par=partitionPrev(arr,start,end); quick(arr,start,par-1); quick(arr,par+1,end); } public static void insertSortRange(int[] arr,int left,int right){ for (int i = left+1; i <= right; i++) { int temp=arr[i]; int j=i-1; for (; j >=left ; j--) { if (arr[j]>temp){ arr[j+1]=arr[j]; }else{ break; } } arr[j+1]=temp; } } /** * 三位取中 * @param arr * @param left * @param right * @return */ public static int midThreeNum(int[] arr,int left,int right){ int mid=(left+right)/2; if (arr[left]<arr[right]){ if (arr[mid]<arr[left]){ return left; }else if(arr[mid]>arr[right]){ return right; }else{ return mid; } }else{ if (arr[mid]<arr[right]){ return right; }else if(arr[mid]>arr[left]){ return left; }else{ return mid; } } }

同时,我们也可以用非递归的方式去实现快速排序

/** * 非递归实现快速排序 * @param arr */ public static void quickSortnot(int[] arr){ Stack<Integer> stack=new Stack<>(); int left=0; int right=arr.length-1; int par=partitionHoare(arr,left,right); if (par>left+1){ stack.push(left); stack.push(par-1); } if (par<right-1){ stack.push(par+1); stack.push(right); } while (!stack.empty()){ right=stack.pop(); left=stack.pop(); par=partitionHoare(arr,left,right); if (par>left+1){ stack.push(left); stack.push(par-1); } if (par<right-1){ stack.push(par+1); stack.push(right); } } } 快速排序整体的综合性能和使用场景都是比较好的,所以才敢叫 快速 排序

💵四.归并排序

基本原理

归并排序是一种基于分治思想的排序算法。它的基本原理是将待排序的数组分成两部分,分别对这两部分进行排序,然后将排好序的子数组合并成一个大的有序数组。

算法步骤

分解:将待排序的数组递归地分成两个子数组,直到每个子数组只有一个元素合并:将相邻的两个子数组合并成一个有序的数组,直到整个数组被合并成一个有序的数组。

时间复杂度

归并排序的时间复杂度为O(n log n),其中n是数组的长度。这是因为归并排序的每一层递归都需要O(n)的时间来合并两个子数组,而递归的深度是O(log n)。因此总的时间复杂度是O(n log n)。

稳定性

归并排序是稳定的排序算法。在合并过程中,相同元素的相对位置不会发生变化,只有在不同子数组之间的合并时才会涉及元素交换。

适用性

归并排序适用于各种数据规模的排序,尤其在内存充足的情况下,其性能稳定且良好。由于其稳定性和较好的时间复杂度,归并排序常被用于外部排序,例如对大型文件进行排序。然而,由于其需要额外的空间来存储临时数组,因此在空间复杂度较为敏感的场景下可能不适用。

源代码

/** * 归并排序 * 时间复杂度:0(N * logN) * 空间复杂度:O(N) * 稳定性:稳定的排序 * @param arr */ public static void mergeSort(int[] arr){ mergeSortfun(arr,0,arr.length-1); } public static void mergeSortfun(int[] arr,int left,int right){ if (left>=right){ return; } int mid=(left+right)/2; mergeSortfun(arr,left,mid); mergeSortfun(arr,mid+1,right); //合并 merge(arr,left,right,mid); } public static void merge(int[] arr,int left,int right,int mid){ int s1=left; int e1=mid; int s2=mid+1; int e2=right; int k=0; int[] temp=new int[right-left+1]; //要考虑相等 while(s1<=e1&&s2<=e2){ if (arr[s1]>arr[s2]){ temp[k++]=arr[s2++]; }else{ temp[k++]=arr[s1++]; } } while(s1<=e1){ temp[k++]=arr[s1++]; } while(s2<=e2){ temp[k++]=arr[s2++]; } //至此,temp数组中的所有元素已然有序 //接下来把tmp数组的内容 拷贝到array数组当中 //最后k=temp.length for (int i = 0; i < k; i++) { arr[i+left]=temp[i]; } }

同理可得,可用非递归的方式去实现归并排序:

public static void mergeSortnor(int[] arr){ int gap=1; while(gap< arr.length){ for (int i = 0; i < arr.length; i=i+gap*2) { int left=i; int mid=left+gap-1; if (mid>=arr.length){ mid=arr.length-1; } int right=mid+gap; if (right>=arr.length){ right=arr.length-1; } merge(arr,left,right,mid); } gap*=2; } }

💶五.常用排序算法复杂度及稳定性分析

我们可以对上述接触到的排序算法进行一个简单的分类

排序方法 最好 平均 最坏 空间复杂度 稳定性
冒泡排序 O(n) O(n^2) O(n^2) O(1) 稳定
插入排序 O(n) O(n^2) O(n^2) O(1) 稳定
选择排序 O(n^2) O(n^2) O(n^2) O(1) 不稳定
希尔排序 O(n) O(n^1.3) O(n^2) O(1) 不稳定
堆排序 O(n * log(n)) O(n * log(n)) O(n * log(n)) O(1) 不稳定
快速排序 O(n * log(n)) O(n * log(n)) O(n^2) O(log(n)) ~ O(n) 不稳定
归并排序 O(n * log(n)) O(n * log(n)) O(n * log(n)) O(n) 稳定

        在时间复杂度方面,快速排序、堆排序和归并排序是最快的,它们的时间复杂度都是         O(n log n),适用于大多数场景。而插入排序、希尔排序、选择排序和冒泡排序的时间复杂度都在O(n^2)级别,适用于小规模数据或者教学目的。

        在稳定性方面,插入排序、归并排序和冒泡排序是稳定的排序算法,而希尔排序、选择排序、堆排序和快速排序是不稳定的排序算法。稳定性表示相同元素的相对位置是否在排序前后保持不变。

        在空间复杂度方面,除了归并排序需要额外的O(n)空间来存储临时数组外,其他排序算法的空间复杂度都是常数级别的,即O(1)。

💷 六.其他非基于比较排序(了解)

💷1.计数排序

基本原理

计数排序是一种非比较性的排序算法,其基本原理是统计待排序序列中每个元素的出现次数,然后根据元素的值将其放置到正确的位置上。计数排序假设待排序的元素都是整数,并且范围在一个已知的区间内。

算法步骤

统计计数: 遍历待排序的数组,统计每个元素出现的次数,并将统计结果存储在一个辅助数组中。累加计数: 将统计数组中的元素累加,得到每个元素在排序后的数组中的位置。排序: 遍历待排序的数组,根据统计数组中每个元素的值,将元素放置到排序后的数组中相应的位置上。输出: 将排序后的数组输出作为排序结果。

时间复杂度

计数排序的时间复杂度为O(n + k),其中n是待排序数组的长度,k是待排序数组中元素的取值范围。在最坏情况下,即元素都是相同的,也需要进行n次遍历,因此时间复杂度为O(n)。而在元素范围较大的情况下,k会对时间复杂度产生影响,但通常情况下k远小于n,所以计数排序的时间复杂度可以近似看作是线性的。

稳定性

计数排序是稳定的排序算法。在排序过程中,相同元素的相对位置不会发生变化,只有根据元素的值进行元素的移动。

适用性

计数排序适用于元素取值范围较小,且待排序数组长度较大的情况。由于计数排序不涉及元素之间的比较,因此在某些情况下,它比基于比较的排序算法效率更高。然而,需要注意的是,计数排序需要额外的空间来存储统计数组,因此在元素范围非常大的情况下可能会占用过多内存。

源代码

/** * 计数排序 * 时间复杂度:O(N+范围) * 空间复杂度:O(范围) * 稳定性:稳定 * @param array */ public static void countSort(int[] array) { //1. 遍历数组 求最大值 和 最小值 int maxVal = array[0]; int minVal = array[0]; for (int i = 0; i < array.length; i++) { if(maxVal < array[i]) { maxVal = array[i]; } if(minVal > array[i]) { minVal = array[i]; } } //2. 定义count数组 int[] count = new int[maxVal - minVal + 1]; //3. 遍历array数组 把值 放入 计数数组当中 for (int i = 0; i < array.length; i++) { int val = array[i];//98 count[val - minVal]++; } //4. 以上3步完成之后,计数数组 已经存好了对应的数据 // 接下来 开始遍历 计数数组 int index = 0;//array的下标 for (int i = 0; i < count.length; i++) { while (count[i] > 0) { array[index] = i+minVal; index++; count[i]--; } } }

💸2.基数排序

基数排序(Radix sort)是一种非比较型整数排序算法,它的基本原理是将整数按位数切割成不同的数字,然后按每个位数分别比较。基数排序可以采用最低有效数字(LSD)或最高有效数字(MSD)的方式进行排序。

算法步骤

确定排序的位数,即确定需要比较的最大位数。初始化10个桶(0-9),用于存放待排序的数字。从最低位开始,将所有数字按照当前位的值放入对应的桶中。将所有桶中的数字依次取出,按照桶的顺序重新排列原始数组。重复步骤3和步骤4,直到所有位都被比较完毕。

时间复杂度

基数排序的时间复杂度取决于待排序数字的位数和桶的数量。如果有n个数字,每个数字有d位,基数排序的时间复杂度为O(d*n)。稳定性方面,基数排序是稳定的排序算法,即相等元素的相对顺序在排序前后保持不变。

适用性

待排序的数字是整数类型,且位数相同。待排序的数字范围不太大,可以容易地确定排序的位数。可以使用辅助空间来存储桶和中间结果。

总结起来,基数排序是一种非比较型整数排序算法,通过按位数切割和桶的分配来实现排序。它具有稳定性和适用性的优点,并且时间复杂度与待排序数字的位数和桶的数量相关。

以下是动图演示

源代码 

/** * 基数排序 * 考虑负数的情况还可以参考: https://code.i-harness.com/zh-CN/q/e98fa9 */public class RadixSort implements IArraySort { @Override public int[] sort(int[] sourceArray) throws Exception { // 对 arr 进行拷贝,不改变参数内容 int[] arr = Arrays.copyOf(sourceArray, sourceArray.length); int maxDigit = getMaxDigit(arr); return radixSort(arr, maxDigit); } /** * 获取最高位数 */ private int getMaxDigit(int[] arr) { int maxValue = getMaxValue(arr); return getNumLenght(maxValue); } private int getMaxValue(int[] arr) { int maxValue = arr[0]; for (int value : arr) { if (maxValue < value) { maxValue = value; } } return maxValue; } protected int getNumLenght(long num) { if (num == 0) { return 1; } int lenght = 0; for (long temp = num; temp != 0; temp /= 10) { lenght++; } return lenght; } private int[] radixSort(int[] arr, int maxDigit) { int mod = 10; int dev = 1; for (int i = 0; i < maxDigit; i++, dev *= 10, mod *= 10) { // 考虑负数的情况,这里扩展一倍队列数,其中 [0-9]对应负数,[10-19]对应正数 (bucket + 10) int[][] counter = new int[mod * 2][0]; for (int j = 0; j < arr.length; j++) { int bucket = ((arr[j] % mod) / dev) + mod; counter[bucket] = arrayAppend(counter[bucket], arr[j]); } int pos = 0; for (int[] bucket : counter) { for (int value : bucket) { arr[pos++] = value; } } } return arr; } /** * 自动扩容,并保存数据 * * @param arr * @param value */ private int[] arrayAppend(int[] arr, int value) { arr = Arrays.copyOf(arr, arr.length + 1); arr[arr.length - 1] = value; return arr; }}

💳 3.桶排序

桶排序(Bucket sort)是一种非比较型的排序算法,它将待排序元素分为若干个区间(桶),然后将每个元素放入对应的桶中。每个桶内部使用其他排序算法(如插入排序)进行排序,最后按照桶的顺序依次输出各个桶中的元素。

基本原理:

确定桶的数量,可以根据待排序元素的范围和分布情况灵活设定。将待排序元素依次放入对应的桶中。对每个桶中的元素进行排序,可以选择其他排序算法。按照桶的顺序依次输出各个桶中的元素,即得到有序序列。

算法步骤:

初始化桶和空数组,桶的数量根据待排序元素范围和分布情况确定。遍历待排序元素,将每个元素放入对应的桶中。对每个桶中的元素进行排序,可以使用插入排序等其他排序算法。按照桶的顺序,将各个桶中的元素依次取出放入空数组中。输出空数组,即得到有序序列。

时间复杂度: 桶排序的时间复杂度取决于元素的分布情况和桶的数量。在最均匀的情况下,平均时间复杂度和最佳时间复杂度均为O(n + k),其中n为元素个数,k为桶的数量。但在最差情况下,如果元素全部落在同一个桶中,则时间复杂度为O(n^2)。需要注意的是,桶排序的时间复杂度与元素大小无关。

稳定性:

桶排序是一种稳定的排序算法,即相等元素的相对顺序在排序前后保持不变。这是因为在将元素放入桶及桶内部排序时,采用了稳定的排序算法,如插入排序。

适用性: 

待排序元素是均匀分布的。可以确定合适的桶的数量,以尽量减少桶之间元素的差距。桶内部的排序算法具有较高的效率。

源代码 

public static void bucketSort(int[] arr){ // 计算最大值与最小值 int max = Integer.MIN_VALUE; int min = Integer.MAX_VALUE; for(int i = 0; i < arr.length; i++){ max = Math.max(max, arr[i]); min = Math.min(min, arr[i]); } // 计算桶的数量 int bucketNum = (max - min) / arr.length + 1; ArrayList<ArrayList<Integer>> bucketArr = new ArrayList<>(bucketNum); for(int i = 0; i < bucketNum; i++){ bucketArr.add(new ArrayList<Integer>()); } // 将每个元素放入桶 for(int i = 0; i < arr.length; i++){ int num = (arr[i] - min) / (arr.length); bucketArr.get(num).add(arr[i]); } // 对每个桶进行排序 for(int i = 0; i < bucketArr.size(); i++){ Collections.sort(bucketArr.get(i)); } // 将桶中的元素赋值到原序列int index = 0;for(int i = 0; i < bucketArr.size(); i++){for(int j = 0; j < bucketArr.get(i).size(); j++){arr[index++] = bucketArr.get(i).get(j);}} }

总结:桶排序是一种非比较型的排序算法,通过将元素放入对应的桶中,并对每个桶内部进行排序,最后按照桶的顺序输出得到有序序列。它的时间复杂度取决于元素的分布情况和桶的数量,稳定性较高,并适用于元素均匀分布的情况。

🧾七.总结与反思

人的成长要接受四个方面的教育:父母、老师、书籍,社会。有趣的是,后者似乎总是与前面三种背道而驰。

在学习了冒泡排序、快速排序、归并排序以及基于非比较的排序算法之后,我们可以对这些排序算法进行总结和反思。

冒泡排序

冒泡排序是一种简单的排序算法,其基本思想是将相邻的元素两两比较,如果前一个元素大于后一个元素,则交换这两个元素的位置。通过多次遍历整个数组,每次都将最大的元素"浮"到数组的末尾,从而实现排序。时间复杂度为O(n^2),不适用于大规模数据的排序。

快速排序

快速排序是一种高效的排序算法,其基本思想是选择一个基准值,将数组分为左右两部分,使得左半部分的所有元素小于等于基准值,右半部分的所有元素大于等于基准值,然后递归地对左右两部分排序。由于采用了分治的思想,并且在平均情况下时间复杂度为O(nlogn),因此快速排序是常用的排序算法之一。

归并排序

归并排序是一种稳定的排序算法,其基本思想是将待排序序列不断划分成更小的子序列,直到每个子序列只有一个元素,然后再将相邻的子序列合并成一个有序序列。由于采用了分治的思想,并且时间复杂度始终为O(nlogn),因此归并排序也是常用的排序算法之一。

非基于比较的排序算法

非基于比较的排序算法不需要进行元素之间的比较,因此它们常常具有线性的时间复杂度,但是空间复杂度较高。这类算法包括计数排序、桶排序和基数排序等。

总体来说,不同的排序算法适用于不同的场景,我们需要根据具体的问题和数据特点选择合适的排序算法。同时,我们还应该注意算法的时间复杂度、稳定性和空间复杂度等方面,以便在实际应用中能够达到更好的效果。


🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀🍀

以上,就是本期的全部内容啦,若有错误疏忽希望各位大佬及时指出💐

  制作不易,希望能对各位提供微小的帮助,可否留下你免费的赞呢🌸



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。