基于桶的排序之基数排序以及排序方法总结

基于,排序,基数排序,以及,方法,总结 · 浏览次数 : 93

小编点评

**算法和数据结构体系班-左程云** * 排版:快速排序、堆排序、归并排序 * 数据结构:数组、链表、堆、队列 * 算法:排序算法、数据结构操作算法 * 稳定性:基于比较的排序算法 * 常见问题:如何处理相等时?如何进行比较?如何进行排序?

正文

基于桶的排序之基数排序以及排序方法总结

作者:Grey

原文地址:

博客园:基于桶的排序之基数排序以及排序方法总结

CSDN:基于桶的排序之基数排序以及排序方法总结

说明

基于桶的排序有两种,分别是计数排序基数排序

但是这两种排序应用范围有限,需要样本的数据状况满足桶的划分

计数排序算法说明见:基于桶的排序之计数排序

基数排序

一般来讲,基数排序要求,样本是 10 进制的正整数, 流程如下

第一步:找到最大值,这个最大值是几位的,其他数不足这个位数的,用 0 补齐;

例如:

原始数组为

arr = {17,210,3065,40,71,2}

最大值为 3065,是四位的,其他都不是四位的,前面用 0 补充,所以先让数组变成

arr = {0017,0210,3065,0040,0071,0002}

第二步:准备 10 个桶,每个桶是队列;

第三步:从个位依次进桶(和对应桶中的元素用队列相连),然后依次倒出;然后根据十位数进桶(和对应桶中的元素用队列相连),依次倒出;以此类推,一直到最高进桶,然后倒出。最后倒出的顺序就是排序后的结果。

以上述数组为例,基数排序的整个流程如下

第一轮入桶,个位上的数依次是:7,0,5,0,1,2,入桶后,是如下效果:

image

然后出桶,第一轮结果是{0210,0040,0071,0002,3065,0017};

第二轮入桶,十位上的数字分别是:1,4,7,0,6,1,入桶后,效果如下:

image

第二轮出桶:结果是{0002,0210,0017,0040,3065,0071};

第三轮入桶,百位上的数字分别是:0,2,0,0,0,0,入桶后,效果如下:

image

第四轮入桶,也是最后一轮入桶,千位上的数字分别是:0,0,0,3,0,0,入桶后,效果如下:

image

最后一轮出桶:结果是{0002,0017,0040,0071,0210,3065},已排好序。

上述是基数排序的流程,但是在算法实现上,有更优化的解法

根据整个基数排序的算法,代码上做了一些优化,用了一个包含十个元素的数组count来表示桶,而且整个代码没有用队列这个数据结构,仅用 count 数组就实现了入桶和出桶的过程,接下来一一分析一下代码,其中helper数组用于存排序后的数组,bits表示最大数十进制一共有几位,流程和之前提到的算法流程一致:

// 从个位开始,一直到最高位,不断入桶出桶
for (int bit = 1; bit <= bits; bit++) {
    // 入桶
    // 出桶
}

入桶的逻辑,原先我们需要把入桶的值记录到桶对应的队列中,如今不需要,我们只需要记录一个个数即可,就是如下逻辑

// 从个位开始,一直到最高位,不断入桶出桶
for (int bit = 1; bit <= bits; bit++) {
    int[] count = new int[10];
    for (int num : arr) {
        count[digit(num, bit)]++;
    }
    // 出桶
}

以上述示例数组来说明,示例数组初始状态是{0017,0210,3065,0040,0071,0002},经过第一轮个位数的入桶操作,count数组会变成{2,1,1,0,0,1,0,1,0,0},如下示例图

原始算法

image

用 count 优化后

image

可以看到 count 只存了数组中的数的有相同位数值的数有多少个。

比如:

count[0] = 2; // 说明 0 号桶在第一轮入桶的时候,有两个数,也说明个位上是 0 的数有两个。
count[5] = 1; // 说明 5 号桶在第一轮入桶的时候,有一个数,也说明个位上是 5 的数有一个。
......

接下来是出桶操作,原始算法中,值存在队列,从左到右遍历桶,桶中元素按队列遍历出来即可;优化后,只有一个count数组,count 数组只记录了个数,如何实现出桶呢? 客观上,在第一轮中,出桶顺序是{0210,0040,0071,0002,3065,0017},其实,就是出桶编号从小到大,桶中的数依次出来。

基于第一轮的count={2,1,1,0,0,1,0,1,0,0}可得到其前缀和数组{2,3,4,4,4,5,5,6,6,6},最大编号且包含数组元素的桶是 7 号桶,且 7 号桶中只有一个数,就是 0017 ,所以这个数一定是最后出桶的那个数!接下来包含元素的最大桶编号是 5 号桶,5 号桶只有一个数,就是 3065,这个数一定是倒数第二顺序出来的数!依次类推,就可以把所有第一轮出桶的数按顺序提取出来,核心代码入下:

      // 前缀和
      for (int j = 1; j < 10; j++) {
        count[j] = count[j - 1] + count[j];
      }
      // 倒序遍历数组
      for (int i = arr.length - 1; i >= 0; i--) {
        int pos = digit(arr[i], bit);
        // 数组中某一位是 pos 的数,在某一轮入桶后
        // 出桶的时候,应该处在什么位置!!!
        help[--count[pos]] = arr[i];
      }

完整代码见

public class Code_RadixSort {

  // 非负数
  public static void radixSort(int[] arr) {
    if (arr == null || arr.length <= 1) {
      return;
    }
    int max = arr[0];
    for (int i = 1; i < arr.length; i++) {
      max = Math.max(arr[i], max);
    }
    // 最大值有几位
    int bits = 0;
    while (max != 0) {
      bits++;
      max /= 10;
    }
    int[] help = new int[arr.length];
    for (int bit = 1; bit <= bits; bit++) {
      int[] count = new int[10];
      for (int num : arr) {
        count[digit(num, bit)]++;
      }
      // 前缀和
      for (int j = 1; j < 10; j++) {
        count[j] = count[j - 1] + count[j];
      }
      // 倒序遍历数组
      for (int i = arr.length - 1; i >= 0; i--) {
        int pos = digit(arr[i], bit);
        help[--count[pos]] = arr[i];
      }
      int m = 0;
      for (int num : help) {
        arr[m++] = num;
      }
    }
  }

  // 获取某个数在某一位上的值
  // 从1开始,从个位开始
  public static int digit(int num, int digit) {
    return ((num / (int) Math.pow(10, digit - 1)) % 10);
  }
}

排序总结

时间复杂度 额外空间复杂度 稳定性
选择排序 O(N^2) O(1)
冒泡排序 O(N^2) O(1)
插入排序 O(N^2) O(1)
归并排序 O(N*logN) O(N)
随机快排 O(N*logN) O(logN)
堆排序 O(N*logN) O(1)
计数排序 O(N) O(M)
基数排序 O(N) O(N)

选择排序做不到稳定性,比如:5,5,5,5,5,3,5,5,5

冒泡排序可以做到稳定性,在相等的时候,不往右即可

插入排序可以做到稳定性,在相等的时候,不往左边继续交换即可

快排做不到稳定性,因为partition过程无法稳定,某个数会和小于等于区域交换

0)排序稳定性关键在于处理相等的时候

1)不基于比较的排序,对样本数据有严格要求,不易改写

2)基于比较的排序,只要规定好两个样本怎么比大小就可以直接复用

3)基于比较的排序,时间复杂度的极限是O(N*logN)

4)时间复杂度O(N*logN)、额外空间复杂度低于O(N)、且稳定的基于比较的排序是不存在的。

5)为了绝对的速度选快排、为了省空间选堆排、为了稳定性选归并

更多

算法和数据结构笔记

参考资料

算法和数据结构体系班-左程云

与基于桶的排序之基数排序以及排序方法总结相似的内容:

基于桶的排序之基数排序以及排序方法总结

# 基于桶的排序之基数排序以及排序方法总结 作者:[Grey](https://www.cnblogs.com/greyzeng/) 原文地址: [博客园:基于桶的排序之基数排序以及排序方法总结](https://www.cnblogs.com/greyzeng/p/16929142.html) [

基于桶的排序之计数排序

# 基于桶的排序之计数排序 作者:[Grey](https://www.cnblogs.com/greyzeng/) 原文地址: [博客园:基于桶的排序之计数排序](https://www.cnblogs.com/greyzeng/p/16928076.html) [CSDN:基于桶的排序之计数排序

基于.NetCore开发博客项目 StarBlog - (23) 文章列表接口分页、过滤、搜索、排序

## 前言 上一篇留的坑,火速补上。 在之前的第6篇中,已经有初步介绍,本文做一些补充,已经搞定这部分的同学可以快速跳过,[基于.NetCore开发博客项目 StarBlog - (6) 页面开发之博客文章列表](https://www.cnblogs.com/deali/p/16286780.ht

【转帖】eBay 流量管理之 Kubernetes 网络硬核排查案例

https://www.infoq.cn/article/L4vyfdyvHYM5EV8d3CdD 一、引子 在 eBay 新一代基于 Kubernetes 的云平台 Tess 环境中,流量管理的实现逐步从传统的硬件 Load Balancer 向软件过渡。在 Tess 的设计中,选用了目前比较流行

基于Pair-wise和CrossEncoder训练单塔模型

基于RocketQA的CrossEncoder(交叉编码器)训练的单塔模型,该模型用于搜索的排序阶段,对召回的结果进行重新排序的作用。

C#快速排序算法

快速排序实现原理 快速排序(Quick Sort)是一种常用的排序算法,它基于分治的思想,通过将一个无序的序列分割成两个子序列,并递归地对子序列进行排序,最终完成整个序列的排序。 其基本思路如下: 选择数组中的一个元素作为基准(pivot)。 将数组中小于等于基准的元素放在基准的左边,将大于基准的元

C#堆排序算法

前言 堆排序是一种高效的排序算法,基于二叉堆数据结构实现。它具有稳定性、时间复杂度为O(nlogn)和空间复杂度为O(1)的特点。 堆排序实现原理 构建最大堆:将待排序数组构建成一个最大堆,即满足父节点大于等于子节点的特性。 将堆顶元素与最后一个元素交换:将最大堆的堆顶元素与堆中的最后一个元素交换位

MATLAB实现随机森林(RF)回归与自变量影响程度分析

本文介绍基于MATLAB,利用随机森林(RF)算法实现回归预测,以及自变量重要性排序的操作~

PanGu-Coder2:从排序中学习,激发大模型潜力

华为云CodeArts Snap插件也即将上线基于PanGu-Coder2的百亿级代码生成服务,为Snap用户提供更全面的语言支持、更智能的代码生成、更准确的补全建议。

[转帖]shell脚本实现文本内容比较交互程序

背景介绍 脚本基于Comm命令进行功能封装,考虑到命令执行前需要对文本进行排序,并且在多文件需要比较内容时可能会导致多个文本混乱,因此使用Shell封装成了一个交互式程序,快速对文件内容进行判断和输出想要的内容内容结果。 脚本介绍 文件内容校验(是否一致内容)定制化输出文本(1.仅文本单独出现内容;