📘
Introduction_to_Algorithms
  • Introduction
  • 第6章:堆排序
    • 练习题
    • 思考题
      • 6-3 Young
  • 第7章:快速排序
    • 练习题
    • 思考题
      • 7-6 对区间的模糊排序
  • 第8章:线性时间排序
    • 练习题
      • 8.3-4 O(n)时间内对[0..n^-1]之间的n个数排序
    • 思考题
      • 8-3 排序不同长度的数据项
  • 第9章 排序和顺序统计学算法导论
    • 练习题
      • 9.1-1
      • 9.3-3 快速排序-最坏时间O(nlgn)
      • 9.3-6 nlgk时间求k分位数
      • 9.3-8 求两个数组的中位数
    • 思考题
      • 9-2-c-带权中位数
  • 第10章:栈和队列
    • 10.1 栈和队列
      • 练习题
      • 10.1-2 用一个数组实现两个栈
      • 10.1-5 双端队列
    • 10.2 链表
      • 练习题
      • 10.2-5 环形链表实现字典操作INSERT、DELETE、SEARCH
    • 10.3 指针和对象实现
      • 练习题
      • 10.3-4 紧凑的多重数组
    • 思考题
  • 第11章 散列表
  • [第12章]
    • [笔记和代码]
      • 12-2 基数树
  • 第14章
    • 笔记和代码
      • 14.3-6 MIN GAP
  • 第15章:动态规划
    • 练习题
    • 思考题
      • 15-2 整齐打印
      • 15-3 编辑距离
  • 第20章:斐波那契堆
    • 练习题
    • 思考题
  • ACM解题报告
    • 1043 八数码问题
    • 1053 Entropy
    • 1114 Piggy-Bank 完全背包
    • 1133 catalan数二维变种
    • 1166 敌兵布阵
    • 1281 棋盘游戏 二分匹配与增广链
    • 1394 Minimum Inversion Number
    • 1394 用线段树求逆序数
    • 1787 欧拉函数之在线算法
    • 2438 三分查找
    • 2473 Junk-Mail Filter 并查集的删除
    • 2824 欧拉公式之打表算法
    • 2855 Fibonacci Check-up 矩阵的应用
    • 2642 Stars 二维树状数组
    • 2888 二维RMQ
    • 3033 分组背包之每组至少选一
    • 3307 A^B = C mod D,已知A,C,D,求解B
    • 3465 Life is a Line 用归并排序求逆序数
    • 3483 A Very Simple Problem 数论+矩阵的应用
    • 3518 后缀数组
    • 3579 中国剩余定理(ACM/不互质的情况)
    • 后缀数组
    • B-树
    • 排序算法总结
Powered by GitBook
On this page
  • 一、题目
  • 二、思路
  • 三、代码
  1. 第8章:线性时间排序
  2. 思考题

8-3 排序不同长度的数据项

一、题目

a)给定一个整数数组,其中不同的整数中包含的数字个数可能不同,但是该数组中,所有整数中总的数字数为n。说明如何在O(n)时间内对该数组进行排序

b)给定一个字符串数组,其中不同的串包含的字符个数可能不同,但所有串中总的字符个数为n。说明如何在O(n)时间内对该数组进行排序

(注意此处的顺序是指标准的字母顺序,例如,a < ab < b)

二、思路

这两题方法是一样的,仅仅是数据类型和进制的区别。 本文就以a)为例。

假设: n:所有整数中总的字数 NUMBER_COUNT:数组中整数的个数 MAX_DIGIT:数组中具有位数最多的那个数的位数

本章主题是非比较排序,又因为题目中已有暗示,效率与数字的位数有关,因此很容易想到的是基数排序。 原始基数排序的时间复杂度:O(NUMBER_COUNT * MAX_DIGIT)

很显然,原始的基数排序不能满足需求,要作一些改进。 分析发现,所有的整数都必须要经过MAX_DIGIT次计算,实际上,对于数位不足的MAX_DIGIT的整数,是不需要计算那么多次的。 如果先对所有的整数分类,位数少的整数,就计算次数少一点,位数多的整数多计算多一点。

这个预分类,就是桶排序的思想了。 先根据整数的位数分装到不同的桶中,然后对每个桶分别做基数排序,这样,有些桶中的元素就不需要计算那么多次了。 最极端的方法,就是每个位数一个桶了 。 那么就是MAX_DIGIT个桶,每i个桶装的是具有i位数的整数。 这个桶中的元素只需要做i次计算。

原始的桶排序是有链表实现的。 但是考虑到接下来要对每个桶做基数排序,链表做的桶就不合适了,因为基数排序需要对数据的随机访问。 于是我只是借用了桶排序的预分类思想,而在实际代码中是以数组的方式实现了。 即,仍是同样的大小的数组,但是按位数从小到大排。相同位数的数不排序。

如果把每个元素的位数看成是这个元素的关键字,然后以关键字从小到大的排序的话,是不是有点像计数排序了? 哇!小小一道题,竟然融合了桶排序、计数排序、基数排序这三种最主要的非比较排序,太厉害了! 1.借用桶排序的思想,先根据位数对所有元素粗排序,然后对每个桶中的元素,根据元素本身的大小进行精确排序 2.粗排序使用计数排序O(NUMBER_COUNT) 3.精确排序使用基数排序O(MAX_DIGIT)

也可以用字典树,见12-2-基数树

三、代码

Previous思考题Next第9章 排序和顺序统计学算法导论

Last updated 5 years ago

产品代码
测试代码