推广 热搜: page  小红  红书  数据  论文  考试  数据分析  关键词  哪些  搜索 

七大排序算法

   日期:2025-01-02     移动:https://sicmodule.kub2b.com/mobile/quote/18081.html

 排序:排序就是对某项数据按照特定的要求,比如大小或字符长短等按照升序或降序排序。

排序过程中设计稳定性,稳定性指的是若有两个相同的数字,比如11。如果排序前11的前面,排完序后1还在1的前面。那么就说这个排序算法是稳定的,相反则说明不稳定。

注意如果本身就是一个稳定的排序,可以将其变成不稳定排序;如果本身就是不稳定排序,不能变成稳定的排序。

目录

常见的排序方法

:直接插入排序

:希尔排序

:选择排序

:堆排序 

:冒泡排序

:快速排序

1.Hoare版

2.挖坑法写快速排序

3.前后指针法

快速排序的优化

非递归实现快速排序

七.归并排序

非递归实现归并排序 

非基于比较的排序

1.计数排序 

2.基数排序

3.桶排序 


上面是基于比较的排序。

下面一个一个的分析

直接插入排序指的是将新的数据插入在已经排好序的序列中。比如我们生活中的玩的斗地主,我们需要将新摸的牌按照大小顺序插入到已经排好的扑克牌中。

例如,将无序的整形数组进行排序

思路

1.首先判断数组的长度,长度<=1,直接返回

2.将数组第i(>=1)个下标位置的元素放在temp中

3.将j下标位置的元素与temp比较。当小于时退出循环,执行4;当大于时,将j位置的元素赋给j+1,然后j--,然后重复这一步直到退出循环(退出循环的结果有两种)

4.将temp的位置赋给j+1下标的值

 
 

直接插入排序总结

1.直接插入排序的时间复杂度:O(N^2)(将逆序的数据排成顺序)、O(N)(数据本身就是有序的)

2.直接插入排序的空间复杂度O(1)

3.直接插入排序适用于数据量小且数据本身趋于有序的情况

4.直接插入排序是一种稳定排序算法 

希尔排序又叫做缩小增量排序,他是直接排序的一种优化。

它的优化逻辑是将一组无序的序列分成若干组gap,然后将每组进行直接插入排序。最终将gap等于1时所得到的序列再进行一次直接插入排序。gap>1时的排序称为预排序,它的作用是每次直接插入排序完后的序列都更趋近于有序,让整个排序的时间减少。

我们知道直接插入排序的最坏时间复杂度为O(N^2),N是序列中元素的个数。现在假设有10000个无序的数据,如果直接插入排序,所需时间为100,000,000。现在将这些数据分成100组,每组100个数据,每组如果采用直接插入排序,需要时间为10000,那么100组所需时间就为1,000,000。所花时间整整降低了100倍。

希尔排序就是用到的上面的逻辑。

例如,将无序的整形数组进行排序

思路参照下面图片

 
 

再来比较一下希尔排序所需时间和直接排序所需时间的比对 

 
 
 
 

可以看到希尔排序明显快直接排序很多。

希尔排序总结

1.希尔排序是对直接插入排序的优化

2.希尔排序中gap的取法很多,但是我们一般都取序列长度的一半或者按照质素来取。

3.希尔排序的时间复杂度:O(n^1.25)~O(1.6*n^1.25)

4.希尔排序是不稳定排序 

选择排序:每次从序列中选出最小(或最大)的一个元素,存放在序列的起始位置;然后再找出序列中次小(或次大)的元素,存放到序列起始的次位置;直到全部待排序的数据 完成排序。

选择排序类似我们生活中的玩扑克牌,一次性排序17张牌。

例如,将无序的整形数组进行排序

思路

1.创建一个零时变量minIndex,让minIndex记录i下标

2.遍历数组,找到最小(最大)的一个数的下标j,将minIndex记录为j。如果这个最小的数就是第一个(或最后一个)数,就不动,否者让minIndex下标的数和第一个数交换。

3.i++,重复1~3直到i>array.length

 
 

堆排序是指利用堆这种数据结构所设计的一种排序算法 在排序过程中如果想升序,那么就要建大堆;如果想降序就要建小堆。

例如,将无序的整形数组进行排序

 
 

再来看一下选择排序和堆排序排序所花的时间,所给的数据量和插入排序、希尔排序一样。

可以看到选择排序是这四种排序算法中用时最多的,而堆排序是用时最少的。

总结一下选择排序和堆排序的特点

选择

1.选择排序的效率很低

2.时间复杂度O(N^2),空间复杂度O(1)

3.不稳定

堆排序

1.效率很高

2.时间复杂度O(N*logN),空间复杂度O(1)

3.不稳定 

冒泡排序是我们接触编程语言最早的一种排序算法,我们大家都很熟悉,这里就不详讲了。

例如,将无序的整形数组进行排序

 
 

再来看一下冒泡排序算法所花时间,数据量同前面一样

可以看到冒泡排序是目前所有排序算法中用时最多的一种排序算法,所以效率极低。 

冒泡排序的特点总结

1.冒泡排序算法很容易理解和掌握,但是它在处理一组很大无序的数据时效率极低。

2.时间复杂度O(N^2)——将逆序转成顺序,O(1)——本身就有序,空间复杂度O(1)

3.是一种稳定的排序

 快速排序是一种基于二叉树结构的交换排序方法,其思想是任取待排序元素序列中的元素作为基准值,按照该排序码将待排序集合分割成两个子序列,左子序列中所有元素均小于基准值,右子序列中所有元素均大于基准值,然后左右子序列重复该过程,直到所有元素都排列在相应位置上为止。

将区间按照基准值分为左右两半部分的常见方式有

1.Hoare版

 例如,将无序的整形数组进行排序

思路

左边第一个元素做基准值key,右边先走(避免left、right相遇时,该位置的元素大于基准值)

(1)定义left、right并附上相应的下标,以left下标所对应的元素为基准

(2)左边的left向右走,右边的right向左走。left找到比基准值大的停下来,right找到比基准值小的停下来。交换此时left、right下标所对应的元素,交换以后继续找。

(3)当left>=right时,让此时left下标的元素和基准值交换。交换以后,以left下标右边和左边为新的待排序数组继续执行1~3,直到整个数组完成排序。

 

 再来看一下这六种排序算法测试同一组大数据所花的时间

因为快速排序和堆排序都是基于二叉树结构的排序算法,所以他们所用的时间差不多。

但是注意

Hoare版本的快排如果序列本来就是有序的,那么如果样本数量很大,就会造成栈溢出

 
 

2.挖坑法写快速排序

思路

(1)定义left、right并赋上相应的下标,记录当前left下标所对应的元素为temp

(2)左边的left向右走、右边的right向左走。right先走,right找到比temp小的值停下来,将right所在位置的元素赋给left所在的位置。left找到比temp大的值停下来,将left所在位置的元素赋给right所在的位置。

(3)当left>=right时,将temp的值赋给left所在的位置,返回left 

(4)以left下标右边和左边为新的待排序数组继续执行1~3,直到整个数组完成排序。

 

3.前后指针法

思路

(1)记录序列左边第一个数为temp,第二个数为cur

(2)从序列左边第二个数(下表为i)开始,比较它和temp的大小关系,若小于,则让cur下标的数和i下标的数交换,同时cur++,i++;若大于,则让i++。重复执行(2)直到i>right退出循环

(3)让temp与cur-1下标位置的数交换,返回cur-1

(4)以(3)返回的结果分成左右两个子序列,重复1~4直到将序列排成有序

 

快速排序的优化

通过上面的测试我们发现,当给一组有序且很大的数据时,如果用快速排序就会造成栈溢出,溢出的原因就是因为快速排序在递归的时候要开辟内存空间,而递归的次数受树高度的影响。给定一组有序序列,在快排时就等同于只有左树或者只有右树,这样递归的次数就是这个序列的长度,因此给定的序列越大,递归次数越多就会越容易栈溢出。

为了解决上面的问题,主要有以下办法

1.采用混合排序(优化的是区间)——没有根本上解决问题

采用混合排序也就是先采用快排,让递归达到某个深度以后采用其他排序算法,这样就可以在一定程度上减缓栈溢出的概率

 

下面是没有优化的效果

然后将代码注释处去掉注释以后

2.采用三数取中法(优化分割区间的方法)——从根本上解决递归深度太深的问题

思路如下

 

 优化以后的结果

非递归实现快速排序

思路见下图

 

 再来看一下非递归快速排序,排序所花时间,数据样本和前面的都一样

将一组有序数据排序

可以看到效率不如优化后的递归排序

将无序数据排成有序

效果也比优化后的递归排序差一点 

快速排序特点总结

1.时间复杂度O(N*logN)——所有的左右子序列刚好是整体序列的一半时

2.空间复杂度O(logN)——满二叉树的高度

3.不稳定

归并排序是利用分治算法思想将序列分解成左右两个子序列,让两个子序列有序以后,再将左右子序列合并排序,最终得到一个完全有序的序列。

思路

一个数组一分为二,两边分别排序,排好序后,创建一个数组,将排好序的数字左右两边比较大小,将小的放在新数组中,遇到某边越界以后,将另一边剩下的数全部拷贝到新数组中,最后将数组拷贝回原来的数组。

具体操作见下图

 
 

非递归实现归并排序 

 思路见下图

 

1.计数排序 

计数排序:统计相同元素出现的次数,根据统计结果将序列回收到原来的序列中

 
 

 计数排序特点总结

1.计数排序在数据范围集中时,效率很高,但是适用范围及场景有限

2.时间复杂度:O(MAX(N,范围))

3.空间复杂度:O(范围)

4.是一种稳定的排序

2.基数排序

基数排序是依次根据个位数、十位数、百位数......的大小来排序 ,最终的结果就是排好序的序列

思路

1.根据所给序列,找到序列中数据的最大值,并求该值的位数。

2.创建十个队列,这里可以将队列形象为桶。根据数据每一位的值放在相应桶中

3.再将桶里面的数据依次取出来

 
 

基数排序特点总结

1.时间复杂度O(n)

2.当元素取值范围较大,但元素个数较少时可以利用基数排序 

3.桶排序 

桶排序是根据所给序列中数据来划分区间,一个区间就是一个桶,将元素之间差值不大的放进一个桶中。然后对桶内数据进行排序,最后将排好序的桶内数据倒出给原来的数组。

思路见下图

 
 

桶排序特点总结

1.时间复杂度O(N)

2.空间复杂度O(N+M)

本文地址:https://sicmodule.kub2b.com/quote/18081.html     企库往 https://sicmodule.kub2b.com/ , 查看更多

特别提示:本信息由相关用户自行提供,真实性未证实,仅供参考。请谨慎采用,风险自负。


0相关评论
相关最新动态
推荐最新动态
点击排行
网站首页  |  关于我们  |  联系方式  |  使用协议  |  版权隐私  |  网站地图  |  排名推广  |  广告服务  |  积分换礼  |  网站留言  |  RSS订阅  |  违规举报  |  鄂ICP备2020018471号