数据结构与算法分析:Java语言描述(原书第3版)

更多详情


内容简介: 本书是国外经典教材,使用卓越的Java编程语言作为实现工具,讨论数据结构(组织大量数据的方法)和算法分析(对算法运行时间的估计)。第3版的主要新增内容包括AVL树删除算法、布谷鸟散列、跳房子散列、基数排序、后缀树和后缀数组等,并对全书代码进行了更新。
本书要求读者具备一定的编程基础,适合作为计算机相关专业高年级本科生和研究生教材,也可供广大程序员参考。

目录: 出版者的话
前言
第1章 引论1
1.1 本书讨论的内容1
1.2 数学知识复习2
1.2.1 指数2
1.2.2 对数2
1.2.3 级数2
1.2.4 模运算4
1.2.5 证明的方法4
1.3 递归简论5
1.4 实现泛型构件pre-Java 57
1.4.1 使用Object表示泛型8
1.4.2 基本类型的包装9
1.4.3 使用接口类型表示泛型9
1.4.4 数组类型的兼容性10
1.5 利用Java 5泛型特性实现泛型构件11
1.5.1 简单的泛型类和接口11
1.5.2 自动装箱/拆箱11
1.5.3 菱形运算符12
1.5.4 带有限制的通配符12
1.5.5 泛型static方法14
1.5.6 类型限界14
1.5.7 类型擦除15
1.5.8 对于泛型的限制15
1.6 函数对象16
小结18
练习18
参考文献19
第2章 算法分析20
2.1 数学基础20
2.2 模型22
2.3 要分析的问题22
2.4 运行时间计算24
2.4.1 一个简单的例子24
2.4.2 一般法则24
2.4.3 最大子序列和问题的求解26
2.4.4 运行时间中的对数31
2.4.5 分析结果的准确性33
小结33
练习34
参考文献37
第3章 表、栈和队列39
3.1 抽象数据类型39
3.2 表ADT39
3.2.1 表的简单数组实现40
3.2.2 简单链表40
3.3 Java Collections API中的表41
3.3.1 Collection接口41
3.3.2 Iterator接口42
3.3.3 List接口、ArrayList类和LinkedList类43
3.3.4 例子:remove方法对LinkedList类的使用44
3.3.5 关于ListIterator接口46
3.4 ArrayList类的实现46
3.4.1 基本类46
3.4.2 迭代器、Java嵌套类和内部类49
3.5 LinkedList类的实现52
3.6 栈ADT58
3.6.1 栈模型58
3.6.2 栈的实现59
3.6.3 应用59
3.7 队列ADT65
3.7.1 队列模型65
3.7.2 队列的数组实现65
3.7.3 队列的应用66
小结67
练习67
第4章 树71
4.1 预备知识71
4.1.1 树的实现72
4.1.2 树的遍历及应用72
4.2 二叉树75
4.2.1 实现76
4.2.2 例子:表达式树76
4.3 查找树ADT——二叉查找树78
4.3.1 contains方法79
4.3.2 findMin方法和findMax方法80
4.3.3 insert方法80
4.3.4 remove方法82
4.3.5 平均情况分析83
4.4 AVL树86
4.4.1 单旋转87
4.4.2 双旋转89
4.5 伸展树94
4.5.1 一个简单的想法(不能直接使用)95
4.5.2 展开96
4.6 再探树的遍历100
4.7 B树101
4.8 标准库中的集合与映射105
4.8.1 关于Set接口105
4.8.2 关于Map接口105
4.8.3 TreeSet类和TreeMap类的实现106
4.8.4 使用多个映射的实例106
小结111
练习111
参考文献115
第5章 散列117
5.1 一般想法117
5.2 散列函数117
5.3 分离链接法119
5.4 不用链表的散列表123
5.4.1 线性探测法123
5.4.2 平方探测法124
5.4.3 双散列129
5.5 再散列130
5.6 标准库中的散列表132
5.7 最坏情形下O(1)访问的散列表…133
5.7.1 完美散列133
5.7.2 布谷鸟散列135
5.7.3 跳房子散列143
5.8 通用散列法146
5.9 可扩散列148
小结149
练习150
参考文献153
第6章 优先队列(堆)156
6.1 模型156
6.2 一些简单的实现156
6.3 二叉堆157
6.3.1 结构性质157
6.3.2 堆序性质157
6.3.3 基本的堆操作158
6.3.4 其他的堆操作162
6.4 优先队列的应用164
6.4.1 选择问题164
6.4.2 事件模拟165
6.5 d-堆166
6.6 左式堆167
6.6.1 左式堆性质167
6.6.2 左式堆操作168
6.7 斜堆172
6.8 二项队列173
6.8.1 二项队列结构174
6.8.2 二项队列操作174
6.8.3 二项队列的实现176
6.9 标准库中的优先队列180
小结180
练习181
参考文献184
第7章 排序186
7.1 预备知识186
7.2 插入排序186
7.2.1 算法186
7.2.2 插入排序的分析187
7.3 一些简单排序算法的下界187
7.4 希尔排序188
7.5 堆排序191
7.6 归并排序193
7.7 快速排序198
7.7.1 选取枢纽元199
7.7.2 分割策略200
7.7.3 小数组202
7.7.4 实际的快速排序例程202
7.7.5 快速排序的分析203
7.7.6 选择问题的线性期望时间算法206
7.8 排序算法的一般下界207
7.9 选择问题的决策树下界209
7.10 对手下界210
7.11 线性时间的排序:桶排序和基数排序212
7.12 外部排序216
7.12.1 为什么需要一些新的算法217
7.12.2 外部排序模型217
7.12.3 简单算法217
7.12.4 多路合并218
7.12.5 多相合并219
7.12.6 替换选择219
小结220
练习221
参考文献225
第8章 不相交集类227
8.1 等价关系227
8.2 动态等价性问题227
8.3 基本数据结构229
8.4 灵巧求并算法231
8.5 路径压缩233
8.6 路径压缩和按秩求并的最坏情形234
8.6.1 缓慢增长的函数235
8.6.2 利用递归分解的分析235
8.6.3 O(M log*N)界240
8.6.4 O(Mα(M,N))界240
8.7 一个应用241
小结243
练习243
参考文献244
第9章 图论算法246
9.1 若干定义246
9.2 拓扑排序248
9.3 最短路径算法250
9.3.1 无权最短路径251
9.3.2 Dijkstra算法254
9.3.3 具有负边值的图258
9.3.4 无圈图259
9.3.5 所有点对最短路径261
9.3.6 最短路径的例子261
9.4 网络流问题262
9.5 最小生成树267
9.5.1 Prim算法267
9.5.2 Kruskal算法269
9.6 深度优先搜索的应用270
9.6.1 无向图270
9.6.2 双连通性271
9.6.3 欧拉回路273
9.6.4 有向图275
9.6.5 查找强分支276
9.7 NP-完全性介绍277
9.7.1 难与易278
9.7.2 NP类278
9.7.3 NP-完全问题279
小结280
练习280
参考文献284
第10章 算法设计技巧288
10.1 贪婪算法288
10.1.1 一个简单的调度问题288
10.1.2 哈夫曼编码290
10.1.3 近似装箱问题293
10.2 分治算法298
10.2.1 分治算法的运行时间298
10.2.2 最近点问题300
10.2.3 选择问题302
10.2.4 一些算术问题的理论改进304
10.3 动态规划307
10.3.1 用一个表代替递归307
10.3.2 矩阵乘法的顺序安排309
10.3.3 最优二叉查找树311
10.3.4 所有点对最短路径312
10.4 随机化算法314
10.4.1 随机数发生器315
10.4.2 跳跃表319
10.4.3 素性测试320
10.5 回溯算法322
10.5.1 收费公路重建问题323
10.5.2 博弈326
小结331
练习331
参考文献336
第11章 摊还分析340
11.1 一个无关的智力问题340
11.2 二项队列340
11.3 斜堆344
11.4 斐波那契堆345
11.4.1 切除左式堆中的节点346
11.4.2 二项队列的懒惰合并347
11.4.3 斐波那契堆操作349
11.4.4 时间界的证明350
11.5 伸展树351
小结354
练习354
参考文献355
第12章 高级数据结构及其实现356
12.1 自顶向下伸展树356
12.2 红黑树362
12.2.1 自底向上的插入362
12.2.2 自顶向下红黑树363
12.2.3 自顶向下的删除367
12.3 treap树368
12.4 后缀数组与后缀树370
12.4.1 后缀数组371
12.4.2 后缀树373
12.4.3 线性时间的后缀数组和后缀树的构建375
12.5 k-d树385
12.6 配对堆387
小结392
练习393
参考文献396
索引399

前言: 本书目标
本书新的Java版论述数据结构——组织大量数据的方法,以及算法分析——算法运行时间的估计。随着计算机的速度越来越快,对于能够处理大量输入数据的程序的需求变得日益迫切。可是,由于在输入量很大的时候程序的低效率变得非常明显,因此这又要求对效率问题给予更仔细的关注。通过在实际编程之前对算法的分析,我们可以确定某个特定的解法是否可行。例如,查阅本书中一些特定的问题,可以看到我们如何通过巧妙的实现,将其处理大量数据的时间限制从几个世纪减至不到1秒。因此,我们在提出所有算法和数据结构时都会阐释其运行时间。在某些情况下,对于影响实现的运行时间的一些微小细节都需要认真探究。
一旦确定了解法,接着就要编写程序。随着计算机功能的日益强大,它们必须解决的问题也变得更加庞大和复杂,这就要求我们开发更加复杂的程序。本书的目的是同时教授学生良好的程序设计技巧和算法分析能力,使得他们能够以最高的效率开发出这种程序。
本书适用于高级数据结构(CS7)课程或是第一年研究生的算法分析课程。学生应该掌握一些中级编程知识,包括基于对象的程序设计和递归等内容,并具备一些离散数学的背景。
第3版中最显著的变化
第3版订正了大量的错误,也修改了很多地方,以使内容更加清晰。此外还有以下修订:
●第4章包括了AVL树的删除算法——这也是读者经常需要的内容。
●第5章进行了大量修改和扩充,现在包含两种新算法:布谷鸟散列(cuckoo hashing)和跳房子散列(hopscotch hashing)。此外还增加了一节讨论通用散列法。
●第7章现在包含了基数排序的内容,并且增加了一节讨论下界的证明。
●第8章用到Seidel和Sharir提出的新的并查集分析,并且证明了O(Mα(M,N))界,而不是前一版中比较弱的O(Mlog*N)界。
●第12章增加了后缀树和后缀数组的内容,包括Karkkainen和Sanders提出的构造后缀数组的线性时间算法(附带实现)。关于确定性跳跃表和AA树的章节被删除。
●通篇代码已做更新,使用了Java 7的菱形运算符。
处理方法
虽然本书的内容大部分都与语言无关,但是,程序设计还是需要使用某种特定的语言。正如书名所示,我们为本书选择了Java。
人们常常将Java和C++比较。Java具有许多优点,程序员常常把Java看成是一种比C++更安全、更具有可移植性并且更容易使用的语言。因此,这使得它成为讨论和实现基础数据结构的一种优秀的核心语言。Java的其他重要的方面,诸如线程和GUI(图形用户界面),虽然很重要,但是本书并不需要,因此也就不再讨论。
完整的Java和C++版数据结构均在互联网上提供。我们采用相似的编码约定以使得这两种语言之间的对等性更加明显。
内容概述
第1章包含离散数学和递归的一些复习材料。我相信熟练掌握递归的唯一办法是反复不断地研读一些好的用法。因此,除第5章外,递归遍及本书每一章的例子之中。第1章还介绍了一些相关内容,作为对Java中“继承”的复习,包括对Java泛型的讨论。
第2章讨论算法分析,阐述渐近分析及其主要缺点,提供了许多例子,包括对对数级运行时间的深入分析。我们通过直观地把递归程序转变成迭代程序,对一些简单递归程序进行了分析。更复杂的分治程序也在此介绍,不过有些分析(求解递推关系)要推迟到第7章再进行详细讨论。
第3章介绍表、栈和队列。包括对Collections API ArrayList类和LinkedList类的讨论,提供了Collections API ArrayList类和LinkedList类的一个重要子集的若干实现。
第4章讨论树,重点是查找树,包括外部查找树(B-树)。UNIX文件系统和表达式树是作为例子来介绍的。这一章还介绍了AVL树和伸展树。查找树实现细节的更仔细的处理可在第12章找到。树的另外一些内容(如文件压缩和博弈树)推迟到第10章讨论。外部介质上的数据结构作为若干章中的最后论题来考虑。对于Collections API TreeSet类和TreeMap类的讨论,则通过一个重要的例子来展示三种单独的映射在求解同一个问题中的使用。
第5章讨论散列表,既包括经典算法,如分离链接法和线性及平方探测法,同时也包括几个新算法,如布谷鸟散列和跳房子散列。本章还讨论了通用散列法,并且在章末讨论了可扩散列。
第6章是关于优先队列的。二叉堆也在这里讲授,还有些附加的材料论述优先队列某些理论上有趣的实现方法。斐波那契堆在第11章讨论,配对堆在第12章讨论。
第7章论述排序。这一章特别关注编程细节和分析。所有重要的通用排序算法均在该章进行了讨论和比较。此外,还对四种排序算法做了详细的分析,它们是插入排序、希尔排序、堆排序以及快速排序。这一版新增的是基数排序以及对选择类问题的下界的证明。本章末尾讨论了外部排序。
第8章讨论不相交集算法并证明其运行时间。分析部分是新的。这是简短且特殊的一章,如果不讨论Kruskal算法则可跳过该章。
第9章讲授图论算法。图论算法之所以有趣,不仅因为它们在实践中经常出现,而且还因为它们的运行时间强烈地依赖于数据结构的恰当使用。实际上,所有标准算法都和适用的数据结构、伪代码以及运行时间的分析一起介绍。为了恰当地理解这些问题,我们对复杂性理论(包括NP-完全性和不可判定性)进行了简短的讨论。
第10章通过考察一般性的问题求解技术来介绍算法设计。本章通过大量的例子来增强理解。这一章及后面各章使用的伪代码使得读者在理解例子时不会被实现的细节所困扰。
第11章处理摊还分析,主要分析三种数据结构,它们分别在第4章、第6章以及本章(斐波那契堆)介绍。
第12章讨论查找树算法、后缀树和数组、k-d树和配对堆。不同于其他各章,本章给出了查找树和配对堆完整且仔细的实现。材料的安排使得教师可以把一些内容纳入其他各章的讨论之中。例如,第12章中的自顶向下红黑树可以和(第4章的)AVL树一起讨论。
第1~9章为大多数一学期的数据结构课程提供了足够的材料。如果时间允许,那么第10章也可以包括进来。研究生的算法分析课程可以使用第7~11章的内容。第11章所分析的高级数据结构可以很容易地被前面各章所提及。第9章里所讨论的NP-完全性太过简短,不适用于这样的课程。另外再用一部NP-完全性方面的著作作为本教材的补充可能是比较有益的。
练习
每章末尾提供的练习与正文中所述内容的顺序相一致。最后的一些练习是对应整章而不是针对特定的某一节的。难度较大的练习标有一个星号,更具挑战的练习标有两个星号。
参考文献
参考文献列于每章的最后。通常,这些参考文献或者是具有历史意义的、给出书中材料的原始出处,或者阐述对书中给出的结果的扩展和改进。有些文献为一些练习提供了解法。
补充材料
下面的补充材料在www.pearsonhighered.com/cssupport对所有读者公开:
●例子程序的源代码
此外,下述材料仅提供给经培生教师资源中心(Pearson’s Instructor Resource Center,IRC)(www.pearsonhighered.com/irc)认可的教师。有意者请访问IRC或联系培生的校园代表以获得访问权限。 关于本书教辅资源,用书教师可向培生教育出版集团北京代表处申请,电话:010-5735 5169/5735 5171,电子邮件:service.cn@pearson.com。——编辑注
●部分练习的解答
●来自本书的一些附图
致谢
在本书的准备过程中,我得到了许多人的帮助,有些已在本书的其他版本中列出,感谢大家。
一如既往地,培生的专家们的努力使得本书的写作过程更加轻松。我愿在此感谢我的编辑Michael Hirsch以及制作编辑Pat Brown。我还要感谢Abinaya Rajendran和她在Integra Software Services的同事,感谢他们使最后的散稿成书的出色工作。贤妻Jill所做的每一件事情都值得我特别感谢。
最后,我还想感谢发来E-mail并指出前面各版中错误和矛盾之处的广大读者。我的网页www.cis.fiu.edu/~weiss包含更新后的源代码(用Java和C++编写)、勘误表以及提交问题报告的链接。
M.A.W.
佛罗里达州迈阿密市