人工智能:一种现代的方法(第3版)

更多详情

内容简介: 《人工智能:一种现代的方法(第3版)》足最权威、最经典的人工智能教材,已被全世界100多个国家的1200多所大学用作教材。
《人工智能:一种现代的方法(第3版)》的最新版全面而系统地介绍了人工智能的理论和实践,阐述了人工智能领域的核心内容,并深入介绍了各个主要的研究方向。全书分为七大部分:第I部分“人工智能”,第II部分“问题求解”,第III部分“知识、推理与规划”,第Ⅳ部分“不确定知识与推理”,第V部分“学习”,第 VI部分“通信、感知与行动”,第VII部分“结论”。本书既详细介绍了人工智能的基本概念、思想和算法,还描述了其各个研究方向最前沿的进展,同时收集整理了详实的历史文献与事件。另外,本书的配套网址http://aima.cs.berkeley.edu/为教师和学生提供了大量教学和学习资料。
《人工智能:一种现代的方法(第3版)》适合于不同层次和领域的研究人员及学生,是高等院校本科生和研究生人工智能课的首选教材,也是相关领域的科研与工程技术人员的重要参考书。

目录: 《人工智能:一种现代的方法(第3版)》
第Ⅰ部分人工智能
第1 章绪论
1.1 什么是人工智能
1.2 人工智能的基础
1.3 人工智能的历史
1.4 最新发展水平
1.5 本章小结
参考文献与历史注释
习题
第2章智能Agen
2.1 Agent 和环境
2.2 好的行为:理性的概念
2.3 环境的性质
2.4 Agent 的结构
2.5 本章小结
参考文献与历史注释
习题
第Ⅱ部分问题求解
第3 章通过搜索进行问题求解
3.1 问题求解Agent5
3.2 问题实例
3.3 通过搜索求解
3.4 无信息搜索策略
3.5 有信息(启发式)的搜索策略
3.6 启发式函数
3.7 本章小结
参考文献与历史注释
习题
第4 章超越经典搜索
4.1 局部搜索算法和最优化问题
4.2 连续空间中的局部搜索
4.3 使用不确定动作的搜索
4.4 使用部分可观察信息的搜索
4.5 联机搜索Agent 和未知环境
4.6 本章小结
参考文献与历史注释
习题
第5 章对抗搜索
5.1 博弈
5.2 博弈中的优化决策
5.3 α-β剪枝
5.4 不完美的实时决策
5.5 随机博弈
5.6 部分可观察的博弈
5.7 博弈程序发展现状
5.8 其他途径
5.9 本章小结
参考文献与历史注释
习题
第6 章约束满足问题
6.1 定义约束满足问题
6.2 约束传播:CSP 中的推理
6.3 CSP 的回溯搜索
6.4 CSP 局部搜索
6.5 问题的结构
6.6 本章小结
参考文献与历史注释
习题
第Ⅲ部分知识、推理与规划
第7章逻辑Agent.
7.1 基于知识的Agent
7.2 Wumpus 世界
7.3 逻辑
7.4 命题逻辑:一种简单逻辑
7.5 命题逻辑定理证明
7.6 有效的命题逻辑模型检验
7.7 基于命题逻辑的Agen
7.8 本章小结
参考文献与历史注释
习题
第8 章一阶逻辑
8.1 重温表示
8.2 一阶逻辑的语法和语义
8.3 运用一阶逻辑
8.4 一阶逻辑的知识工程
8.5 本章小结
参考文献与历史注释
习题
第9 章一阶逻辑的推理
9.1 命题推理与一阶推理
9.2 合一和提升
9.3 前向链接
9.4 反向链接
9.5 归结
9.6 本章小结
参考文献与历史注释
习题
第10章经典规划
10.1 经典规划的定义
10.2 状态空间搜索规划算法
10.3 规划图
10.4 其他经典规划方法
10.5 规划方法分析
10.6 本章小结
参考文献与历史注释
习题
第11章现实世界的规划与行动
11.1 时间、调度和资源
11.2 分层规划
11.3 非确定性领域中的规划与行动
11.4 多Agent 规划
11.5 本章小结
参考文献与历史注释
习题
第12章知识表示
12.1 本体论工程
12.2 类别和对象
12.3 事件
12.4 精神事件和精神对象
12.5 类别的推理系统
12.6 缺省信息推理
12.7 互联网购物世界
12.8 本章小结
参考文献与历史注释
习题
第Ⅳ部分不确定知识与推理
第13章不确定性的量化
13.1 不确定环境下的行动
13.2 基本概率符号
13.3 使用完全联合分布进行推理
13.4 独立性
13.5 贝叶斯规则及其应用
13.6 重游wumpus 世界
13.7 本章小结
参考文献与历史注释
习题
第14章概率推理
14.1 不确定性问题域中的知识表示
14.2 贝叶斯网络的语义
14.3 条件分布的有效表示
14.4 贝叶斯网络中的精确推理
14.5 贝叶斯网络中的近似推理
14.6 关系和一阶概率模型
14.7 不确定推理的其他方法
14.8 本章小结
参考文献与历史注释
习题
第15章时间上的概率推理
15.1 时间与不确定性
15.2 时序模型中的推理
15.3 隐马尔可夫模型
15.4 卡尔曼滤波器
15.5 动态贝叶斯网络
15.6 跟踪多个对象
15.7 本章小结
参考文献与历史注释
习题
第16章定简单决策
16.1 在不确定环境下结合信念与愿望
16.2 效用理论基础
16.3 效用函数
16.4 多属性效用函数
16.5 决策网络
16.6 信息价值
16.7 决策理论专家系统
16.8 本章小结
参考文献与历史注释
习题
第17章制定复杂决策
17.1 序列式决策问题
17.2 价值迭代
17.3 策略迭代
17.4 部分可观察的MDP
17.5 多Agent 的决策:博弈论
17.6 机制设计
17.7 本章小结
参考文献与历史注释
习题
第Ⅴ部分
第18章样例学习
18.1 学习形式
18.2 监督学习
18.3 学习决策树
18.4 评估和选择最佳假说
18.5 学习理论
18.6 带线性模型的回归和分类
18.7 人工神经网
18.8 非参数化模型
18.9 支持向量机
18.10 组合学习
18.11 机器学习实例
18.12 本章小结
参考文献与历史注释
习题
第19章学习中的知识
19.1 学习的逻辑公式化
19.2 学习中的知识
19.3 基于解释的学习
19.4 使用相关性信息学习
19.5 归纳逻辑程序设计
19.6 本章小结
参考文献与历史注释662 练习
第20章学习概率模型
20.1 统计学习
20.2 带完整数据的学习
20.3 隐变量学习:EM 算法
20.4 本章小结
参考文献与历史注释
习题
第21章强化学习
21.1 引言
21.2 被动强化学习
21.3 主动强化学习
21.4 强化学习中的泛化
21.5 策略搜索
21.6 强化学习的应用
21.7 本章小结
参考文献与历史注释
习题
第Ⅵ部分通讯、感知与行动
第22章自然语言处理
22.1 语言模型
22.2 文本分类
22.3 信息检索
22.4 信息抽取
22.5 本章小结
参考文献与历史注释
习题737 第23章用于通讯的自然语言
23.1 短语结构语法
23.2 句法分析
23.3 扩展文法和语义解释
23.4 机器翻译
23.5 语音识别
23.6 本章小结
参考文献与历史注释
习题
第24章感知
24.1 图像生成
24.2 图像预处理
24.3 基于外观的物体识别
24.4 重建三维世界
24.5 基于结构的物体识别
24.6 视觉应用
24.7 本章小结
参考文献与历史注释
习题
第25章机器人学
25.1 引言
25.2 机器人硬件
25.3 机器人的感知
25.4 运动规划
25.5 规划不确定的运动
25.6 运动
25.7 机器人软件体系结构
25.8 应用领域
25.9 本章小结
参考文献与历史注释
习题
第Ⅶ部分结论
第26章哲学基础
26.1 弱人工智能:机器能够智能地行动吗
26.2 强人工智能:机器真能思考吗
26.3 发展人工智能的道德规范与风险
26.4 本章小结
参考文献与历史注释
习题
第27章人工智能:现状与未来
27.1 Agent 的组成部分
27.2 Agent 的体系结构
27.3 我们在沿着正确的方向前进吗
27.4 如果人工智能成功了会怎样
附录A 数学背景
A.1 复杂度分析与O()符号
A.2 向量、矩阵和线性代数
A.3 概率分布
参考文献与历史注释
附录B 关于语言和算法的注释
B.1 用巴科斯范式(BNF )定义语言
B.2 算法的伪代码描述
B.3 联机帮助
参考文献

译者序: 如何使各种计算系统(含软件、硬件、应用、网络、安全等系统)变得像人一样聪明,在计算技术日益普及且人们对其期望越来越高的今天显得格外重要。以理解和模拟人类智能、智能行为及其规律为目的的“人工智能”,从纵向来看,既有建立智能信息处理理论的任务,又有设计可以展现某些近似于人类智能行为的计算系统的使命;从横向来看,它包含知识工程、机器学习、模式识别、自然语言处理、智能机器人和神经计算等诸多内容。至今,基本的研究途径:一是通过为神经活动建立数学模型基于神经心理学来理解和模拟智能,二是不管智能行为的产生原因只追求在效果上实现人类的个体智能行为与群体智能行为。人工智能的目的、任务和使命决定了其研究必有跨学科的特点,必须以生理学、心理学、行为主义、社会学和哲学等学科的成就为基础,通过抽象建立形式体系,即确定知识表示方法和处理方法,最终基于恰当的数据结构和算法加以实现。
1993 年初,在我从南京大学博士后流动站回到国防科技大学后给研究生讲的第一门课就是“人工智能原理”。当时,作为一门必修的核心课程,采用的是一本不错的原版教材。但因该教材后来没有出更新版,故缺少与时俱进的教学内容,于是产生了换教材的想法。1997 年访美期间,在Stanford 大学有幸拜访了人工智能之父John McCarthy,在探讨了有关科研问题并班门弄斧地演示了我们自己研制的一个识别系统后,我询问了他们采用的教材。他说是Stuart J. Russell 和Peter Norvig 编著的“Artificial Intelligence: A Modern Approach”,于是从Stanford 书店买了一本带回来,从第二年开始“人工智能原理”课程便改用该书作教材。至今,15 年过去了,我们一直追随其变迁,从第2 版到第3 版。教学实践证明它确实是一本好教材,难怪世界范围内100 多个国家包括MIT、CMU、Stanford 、UCB、Cornell、UIUC 等国际国内名校在内的1200 余所大学都一直用它作为教材或教学参考书,也难怪它印数巨大且在《高引用计算机科学文献》(《Most Cited Computer Science Citations 》)一览表中名列前25 内,若考虑其出版年代则名列前茅。总之,它确实是人工智能领域的一本最重要的教材(leading textbook)。
本书英文版有1100 多页,教学内容非常丰富,不但涵盖了人工智能基础、问题求解、知识推理与规划等经典内容,而且还包括不确定知识与推理、机器学习、通讯感知与行动等专门知识的介绍。目前我们为本科生开设的学科基础必修课“人工智能导论”主要介绍其中的经典内容,而研究生必修的核心课程“人工智能原理”主要关注其中的专门知识。其实该书也适合希望提高自身计算系统设计水平的广大应用计算技术的社会公众,对参加信息学奥林匹克竞赛和ACM 程序设计竞赛的选手及其教练员也有一定的参考作用。
教学过程中我们发现该书具有以下特点:既重历史又重前沿,既有基于统一框架的继承又有20%左右的更新与发展,既有宽度又有深度,既阐明富于启发性和思想性的见解又强调通过采用伪码来描述算法以确保可操作性和实用性,既追求通俗易懂、由浅入深又强调基本概念的严谨和表述的适度形式化,既借助实例把复杂问题简单化又保持一定的理论概括,既设置了一定数量的课后练习题又提供了丰富的网络教学资源。
同时,我们也注意到:学生们总是反映看英文版教材速度太慢,所以他们总是想方设法再找一本中译版来阅读。正是这样的背景,在本书第3 版英文影印版出版后,我们应清华大学出版社的邀请,启动了长久的翻译工程,先后参加翻译工作的老师有国防科技大学的殷建平教授、祝恩教授、刘越副教授、陈跃新副教授和王挺教授。由于水平有限且工作量巨大,译文中一定存在许多不足,在此敬请各位同行专家学者和广大读者批评指正,欢迎大家将发现的错误或提出的意见与建议发送到邮箱:longqm@tup.tsinghua.edu.cn 。在整个工程即将完成之际,我们特别要感谢清华大学出版社的信任、耐心和支持。
殷建平
2013 年10 月于长沙

前言: 人工智能(Artificial Intelligence,AI)是一个大领域,而本书也是一本“大”书。我们试图全方位探索这个领域,它涵盖逻辑、概率和连续数学,感知、推理、学习和行动以及从微电子设备到机器人行星探测器的所有内容。本书之所以“大”还因为它有一定深度。
本书的副标题是“一种现代的方法”。使用这个相当空洞的短语希望表达的含义是,我们试图将现在已知的内容综合到一个共同的框架中,而不是试图在各自的历史背景下解释人工智能的各个子领域。对于那些自己的研究领域因此没有得到足够重视的人,我们深表歉意。
本版新变化
本版的修订反映了自本书上一版2003 年出版以来人工智能领域发生的变化。人工智能技术有了重要应用,如广泛部署的实用言语识别、机器翻译、自主车辆和家用机器人。算法有了显著突破,如西洋跳棋的解法。理论上也取得了很多进展,尤其是在概率推理、机器学习和计算机视觉等领域。我们认为最重要的是人们对这个领域认识的不断进化,我们以此为据来组织本书。本书的主要变化如下:
更多地强调了部分可观察和不确定的环境,特别是搜索和规划的非随机的环境。在这些环境中引入了信念状态(一个可能世界集)和状态评估(保持信念状态)的概念;本书后面加入了概率。
除了讨论环境的类型和Agent 的分类,我们现在更深入地研究了Agent 能够使用的表示类型。我们区分了原子表示(其中将世界的每个状态视作黑盒)、因子表示(其中状态是属性/值对的集合)和结构表示(其中世界由对象及对象间关系组成)。
在规划部分更深入地研究了部分可观察环境中的连续规划,还包括了一种层次规划的新方法。 在一阶概率模型中加入了新内容,包括了针对对象存在环境中的不确定性的开放-世界模型。 完全重写了机器学习导论章节,更宽泛地研究了更流行的学习算法,并使之具有更
坚实的理论基础。 扩展了Web 搜索和信息抽取以及从超大数据集学习的技术。 本版20%的引用是2003 年以后发表的工作。 估计有20%的材料是相当新的。其余的80%反映了以往的工作,但也被大规模重写,
以便提供一个关于本领域的更统一的视图。
本书概览
统一的主题思想是智能Agent。我们将人工智能定义为对从环境中感知信息并执行行动的Agent 的研究。每个这样的Agent 实现一个把感知序列映射到行动的函数,我们讨论了表达这些函数的不同方法,如反应式Agent、实时规划器和决策理论系统等。我们把学习的角色解释为把设计者的视角扩展到未知环境中,并且指出了这个角色如何约束Agent 设计,有利于显式的知识表示和推理。我们没有把机器人学和视觉当作独立问题对待,而是出现于实现目标的服务中。我们强调在确定合适的Agent 设计时任务环境的重要性。
我们的主要目的是要传达过去五十年间的人工智能研究和过去两千年的相关工作中所涌现出来的思想。在表达这些思想的过程中,我们在保持准确的同时尽力避免在表示上过分形式化。我们使用伪代码算法以使关键思想更具体;这些伪代码在附录B 中有描述。
本书主要用作本科课程或者系列课程的教科书。本书共有27 章,每一章大概相当于一周的课程量,因此,通学本书的全部内容需要两学期。一个学期的课程可以按教师和学生的兴趣选择书中的部分章节。本书也可以用于研究生教学(可能需要加入参考文献中建议的主要资料)。本书的网站http://aima.cs.berkeley.edu 上有教学大纲样本。唯一的前提是对计算机科学中基本概念(算法、数据结构、复杂性)的熟悉程度达到大学二年级水平。大学一年级时学习的微积分和线性代数对一些主题也很有用;必要的数学背景列在附录A 中。
每章最后都有习题。这些习题最好借助http://aima.cs.berkeley.edu 的代码库加以解决。部分习题足够大,可以用作学期项目。一些习题要求对文献进行调研。
书中索引大约有6000 个词条,以帮助读者查找信息。
使用网站
本书网站http://aima.cs.berkeley.edu 上包含:
书中算法的多种程序设计语言的实现。
超过1000 所使用本书的学校列表,多数包括对在线课程资源和教学大纲的链接。
800 多个含有有用AI 内容的网站列表及相关注释。
逐章列出了补充材料及其链接。
如何加入本书讨论组的介绍。
如何联系作者,提出问题和建议的介绍。
错误在所难免,关于如何报告书中错误的介绍。
为教师准备的幻灯片及其他资源。
致谢
即使名字未能列在封面上,但离开了这些人的贡献是不可能有本书的。Jitendra Malik 和David Forsyth 撰写了第24 章(感知),Sebastian Thrun 撰写了第25 章(机器人学)。Vibhu Mittal 撰写了第22 章(自然语言处理)的一部分。Nick Hay,Mehran Sahami 和Ernest Davis 编写了书中的一些习题。Zoran Duric(George Mason),Thomas C. Henderson(Utah),Leon Reznik(RIT),Michael Gourley(Central Oklahoma )和Ernest Davis(NYU)审阅了书稿并给出了有益的建议。我们要特别感谢Ernie Davis,他不知疲倦地阅读了多个草稿,使本书提高了水准。Nick Hay 整理了参考文献,并在截止日到来之际彻夜未眠编写代码直到清晨五点半,使本书变得更好。Jon Barron 使本版的图表更加规范更具水准,而Tim Huang、Mark Paskin 和Cynthia Bruyns 在上一版的图表和算法上提供了帮助。Ravi Mohan 和Ciaran O’Reilly 编写并维护了网站上的Java 代码。John Canny 编写了第一版的机器人学,Douglas Edwards 考察了历史注释。Pearson 的Tracy Dunkelberger、Allison Michael 、Scott Disanno 和Jane Bonnell 等人竭尽全力帮助我们保持进度并给出了很多有益的建议。最有帮助的是Julie Sussman,P.P.A.,她阅读了每一章并提供了大量的改进。上一版的校稿人员会告诉我们掉了一个逗号,该是that 的地方写成了which;Julie 会指出我们掉了一个减号,在该写xj的地方写成了xi。对于书中的拼写错误和容易产生困惑的描述,让人放心的是Julie 至少修订了五处。她甚至在停电没有LCD 时也坚持用灯笼工作。
Stuart 感谢他的父母不断的支持和鼓励,感谢他的妻子Loy Sheflott 的无尽耐心和无穷智慧。他希望Gordon 、Lucy、George 和Isaac 在原谅他花费很多时间在这本书上之后,能很快读到本书。RUGS(Russell's Unusual Group of Students,Russell 的非常学生小组)一如既往地提供了非同寻常的帮助。
Peter 感谢他的父母(Torsten 和Gerda)帮助他迈出的第一步,感谢他的妻子(Kris),孩子(Bella和Juliet),以及所有在他长时间的写作与更长时间的改写过程中鼓励和宽容他的同事和朋友们。
感谢伯克利(Berkeley)、斯坦福(Stanford )和NASA 图书馆的工作人员以及CiteSeer 、维基百科和Google 的开发人员,是他们为我们带来了研究方式的彻底变革。我们无法感谢到所有使用过本书并为本书提出过建议的读者,不过我们在此还是要感谢来自下面这些读者的特别有益的意见:Gagan Aggarwal, Eyal Amir, Ion Androutsopoulos, Krzysztof Apt, Warren Haley Armstrong, Ellery Aziel, Jeff Van Baalen, Darius Bacon, Brian Baker, Shumeet Baluja, Don Barker, Tony Barrett, James Newton Bass, Don Beal, Howard Beck, Wolfgang Bibel, John Binder, Larry Bookman, David R. Boxall, Ronen Brafman, John Bresina, Gerhard Brewka, Selmer Bringsjord, Carla Brodley, Chris Brown, Emma Brunskill, Wilhelm Burger, Lauren Burka, Carlos Bustamante, Joao Cachopo, Murray Campbell, Norman Carver, Emmanuel Castro, Anil Chakravarthy, Dan Chisarick, Berthe Choueiry, Roberto Cipolla, David Cohen, James Coleman, Julie Ann Comparini, Corinna Cortes, Gary Cottrell, Ernest Davis, Tom Dean, Rina Dechter, Tom Dietterich, Peter Drake, Chuck Dyer, Doug Edwards, Robert Egginton, Asma’a El-Budrawy, Barbara Engelhardt, Kutluhan Erol, Oren Etzioni, Hana Filip, Douglas Fisher, Jeffrey Forbes, Ken Ford, Eric Fosler-Lussier, John Fosler, Jeremy Frank, Alex Franz, Bob Futrelle, Marek Galecki, Stefan Gerberding, Stuart Gill, Sabine Glesner, Seth Golub, Gosta Grahne, Russ Greiner, Eric Grimson, Barbara Grosz, Larry Hall, Steve Hanks, Othar Hansson, Ernst Heinz, Jim Hendler, Christoph Herrmann, Paul Hilfinger, Robert Holte, Vasant Honavar, Tim Huang, Seth Hutchinson, Joost Jacob, Mark Jelasity, Magnus Johansson, Istvan Jonyer, Dan Jurafsky, Leslie Kaelbling, Keiji Kanazawa, Surekha Kasibhatla, Simon Kasif, Henry Kautz, Gernot Kerschbaumer, Max Khesin, Richard Kirby, Dan Klein, Kevin Knight, Roland Koenig, Sven Koenig, Daphne Koller, Rich Korf, Benjamin Kuipers, James Kurien, John Lafferty, John Laird, Gus Larsson, John Lazzaro, Jon LeBlanc, Jason Leatherman, Frank Lee, Jon Lehto, Edward Lim, Phil Long, Pierre Louveaux, Don Loveland, Sridhar Mahadevan, Tony Mancill, Jim Martin, Andy Mayer, John McCarthy, David McGrane, Jay Mendelsohn, Risto Miikkulanien, Brian Milch, Steve Minton, Vibhu Mittal, Mehryar Mohri, Leora Morgenstern, Stephen Muggleton, Kevin Murphy, Ron Musick, Sung Myaeng, Eric Nadeau, Lee Naish, Pandu Nayak, Bernhard Nebel, Stuart Nelson, XuanLong Nguyen, Nils Nilsson, Illah Nourbakhsh, Ali Nouri, Arthur Nunes-Harwitt, Steve Omohundro, David Page, David Palmer, David Parkes, Ron Parr, Mark Paskin, Tony Passera, Amit Patel, Michael Pazzani, Fernando Pereira, Joseph Perla, Wim Pijls, Ira Pohl, Martha Pollack, David Poole, Bruce Porter, Malcolm Pradhan, Bill Pringle, Lorraine Prior, Greg Provan, William Rapaport, Deepak Ravichandran, Ioannis Refanidis, Philip Resnik, Francesca Rossi, Sam Roweis, Richard Russell, Jonathan Schaeffer, Richard Scherl, Hinrich Schuetze, Lars Schuster, Bart Selman, Soheil Shams, Stuart Shapiro, Jude Shavlik, Yoram Singer, Satinder Singh, Daniel Sleator, David Smith, Bryan So, Robert Sproull, Lynn Stein, Larry Stephens, Andreas Stolcke, Paul Stradling, Devika Subramanian, Marek Suchenek, Rich Sutton, Jonathan Tash, Austin Tate, Bas Terwijn, Olivier Teytaud, Michael Thielscher, William Thompson, Sebastian Thrun, Eric Tiedemann, Mark Torrance, Randall Upham, Paul Utgoff, Peter van Beek, Hal Varian, Paulina Varshavskaya, Sunil Vemuri, Vandi Verma, Ubbo Visser, Jim Waldo, Toby Walsh, Bonnie Webber, Dan Weld, Michael Wellman, Kamin Whitehouse, Michael Dean White, Brian Williams, David Wolfe, Jason Wolfe, Bill Woods, Alden Wright, Jay Yagnik, Mark Yasuda, Richard Yen, Eliezer Yudkowsky, Weixiong Zhang, Ming Zhao, Shlomo Zilberstein 以及我们尊敬的同事匿名审稿者。

媒体评论: 这个例子说明理性不等于完美。理性是使期望的性能最大化,而完美是使实际的性能最大化。完美对Agent而言是不太合理的要求。关键是如果我们期望Agent最终能采取事实上最好的行动,设计满足这样要求的Agent是不可能的——除非我们能改进水晶球或者时间机器的性能。
因此,对理性的定义并不要求全知,因为理性的选择只依赖于到当时为止的感知序列。我们还要确保没有因漫不经心而让Agent进行愚蠢的活动。例如,如果Agent穿行繁忙的马路前没有观察道路两边的情况,那么它的感知序列就不可能告诉它有大卡车在高速接近。我们对理性的定义会说现在可以穿过马路吗?绝对不会!首先,根据信息不全的感知序列穿行马路是不理性的:不观察的情况下穿行发生事故的风险太大了。其次,理性Agent应该在走上街道之前选择“观察”行动,因为观察有助于最大化期望性能。为了修改未来的感知信息而采取行动——有时称为信息收集——是理性的重要部分,将在第16章中深入讨论。真空吸尘器清洁Agent在初始未知的环境中必须探查,这为我们提供了信息收集的第二个实例。
我们的定义不仅要求理性Agent收集信息,而且要求Agent从它所感知的信息中尽可能多的学习。Agent最初的设定可能反映的是环境的先验知识,但随着Agent经验的丰富这些知识会被改变或者增加。在一些极端的情况中环境被完全当成先验知识。在这样的情况下,Agent不再需要感知和学习;它只要正确地行动就可以。当然,这样的Agent是脆弱的。考虑一下蜣螂。蜣螂做窝并产卵后,会从附近的粪堆取回一个粪球堵住窝的入口。如果粪球在路途中脱离了它的掌握,蜣螂还会继续赶路,并做动作用不存在的粪球塞住入口,而不会注意到粪球已经不见了。蜣螂进化时在它的行为里内建了假设,当该假设被破坏时,就会产生不成功的行为。黑足泥蜂要聪明一些。雌蜂先挖一个洞,出去叮一只毛虫并拖回洞,再次进洞查看,再把毛虫拖到洞里,然后产卵。毛虫在黑足泥蜂孵卵期间作为食物来源。到目前为止一切似乎顺利,但是假如有昆虫学家在雌蜂检查地洞的时候把毛虫挪开几英寸,雌蜂就会回到计划中“拖毛虫到地洞”的步骤,继续进行不做任何修改的计划,甚至在发生过很多次毛虫被移动的干扰后仍然如此。雌蜂无法知道它天生的计划是失败的,因而也不会改变计划。
Agent依赖于设计人员的先验知识而不是它自身的感知信息,这种情况我们会说该Agent缺乏自主性。理性Agent应该是自主的——它应该学习,以弥补不完整的或者不正确的先验知识。例如,学会预见灰尘出现的地点和时间的吸尘器清洁Agent,显然就能比不会预见的Agent要做得好。实践中,很少要求Agent从一开始就完全自主:当Agent没有或者只有很少的经验时,它的行为往往是随机的,除非设计人员提供一些帮助。因此就像进化为动物提供了足够的内建的反射,以使它们能生存足够长的时间进行学习一样,给人工智能的Agent提供一些初始知识以及学习能力是合理的。当得到关于环境的充足经验后,理性Agent的行为才能独立于它的先验知识有效地行动。从而,与学习相结合使得我们可以设计在很多不同环境下都能成功的理性Agent。
……


书摘: 这个例子说明理性不等于完美。理性是使期望的性能最大化,而完美是使实际的性能最大化。完美对Agent而言是不太合理的要求。关键是如果我们期望Agent最终能采取事实上最好的行动,设计满足这样要求的Agent是不可能的——除非我们能改进水晶球或者时间机器的性能。
因此,对理性的定义并不要求全知,因为理性的选择只依赖于到当时为止的感知序列。我们还要确保没有因漫不经心而让Agent进行愚蠢的活动。例如,如果Agent穿行繁忙的马路前没有观察道路两边的情况,那么它的感知序列就不可能告诉它有大卡车在高速接近。我们对理性的定义会说现在可以穿过马路吗?绝对不会!首先,根据信息不全的感知序列穿行马路是不理性的:不观察的情况下穿行发生事故的风险太大了。其次,理性Agent应该在走上街道之前选择“观察”行动,因为观察有助于最大化期望性能。为了修改未来的感知信息而采取行动——有时称为信息收集——是理性的重要部分,将在第16章中深入讨论。真空吸尘器清洁Agent在初始未知的环境中必须探查,这为我们提供了信息收集的第二个实例。
我们的定义不仅要求理性Agent收集信息,而且要求Agent从它所感知的信息中尽可能多的学习。Agent最初的设定可能反映的是环境的先验知识,但随着Agent经验的丰富这些知识会被改变或者增加。在一些极端的情况中环境被完全当成先验知识。在这样的情况下,Agent不再需要感知和学习;它只要正确地行动就可以。当然,这样的Agent是脆弱的。考虑一下蜣螂。蜣螂做窝并产卵后,会从附近的粪堆取回一个粪球堵住窝的入口。如果粪球在路途中脱离了它的掌握,蜣螂还会继续赶路,并做动作用不存在的粪球塞住入口,而不会注意到粪球已经不见了。蜣螂进化时在它的行为里内建了假设,当该假设被破坏时,就会产生不成功的行为。黑足泥蜂要聪明一些。雌蜂先挖一个洞,出去叮一只毛虫并拖回洞,再次进洞查看,再把毛虫拖到洞里,然后产卵。毛虫在黑足泥蜂孵卵期间作为食物来源。到目前为止一切似乎顺利,但是假如有昆虫学家在雌蜂检查地洞的时候把毛虫挪开几英寸,雌蜂就会回到计划中“拖毛虫到地洞”的步骤,继续进行不做任何修改的计划,甚至在发生过很多次毛虫被移动的干扰后仍然如此。雌蜂无法知道它天生的计划是失败的,因而也不会改变计划。
Agent依赖于设计人员的先验知识而不是它自身的感知信息,这种情况我们会说该Agent缺乏自主性。理性Agent应该是自主的——它应该学习,以弥补不完整的或者不正确的先验知识。例如,学会预见灰尘出现的地点和时间的吸尘器清洁Agent,显然就能比不会预见的Agent要做得好。实践中,很少要求Agent从一开始就完全自主:当Agent没有或者只有很少的经验时,它的行为往往是随机的,除非设计人员提供一些帮助。因此就像进化为动物提供了足够的内建的反射,以使它们能生存足够长的时间进行学习一样,给人工智能的Agent提供一些初始知识以及学习能力是合理的。当得到关于环境的充足经验后,理性Agent的行为才能独立于它的先验知识有效地行动。从而,与学习相结合使得我们可以设计在很多不同环境下都能成功的理性Agent。
……