首先,我们回顾了搜索、知识表示和学习在人工智能系统建设中的重要性,并给出了示例,说明合适的知识表示有助于解决问题。
其次,我们介绍了在神话和文学中反复出现的一个主题——创造生命或智能体的尝试总会遇到可怕的后果。也许,我们应该向人工智能界提出一些警告。
本文说明了计算机科学中无法求解的问题的概念,即不存在求解算法的问题。我们自问是否能够创造人类级别的人工智能,就是这样的问题。
接着,我们回顾了半个世纪以来在人工智能领域的成就。
然后,我们讨论了IBM的沃森系统。2011年3月,在一场观众众多的电视比赛中,IBM计算机击败了危险边缘挑战赛中的两位常胜Jeopardy冠军。
最后,我们回顾了关于创造生命的若干理论,并解释了智能和意识。
人工智能概述
之前我们开始了人工智能旅程。当时我们说,如果你想设计智能软件,那这个软件就需要具备以下特点。
(1)搜索能力。
(2)知识表示的语言。
(3)学习的能力。
在早期的工作中,这就已经显而易见,盲目的搜索算法(即没有领域知识),如广度优先搜索和深度优先搜索的算法,无法有效、成功地越过它们所面临的大规模搜索空间这个障碍。
如本书中所述,一条有用的指导原则是,如果你想设计用于执行某项任务的系统,请先查看自然中是否已经存在类似的系统。
如果现在是1902年,而你想设计一个“飞行机器”,那么你的注意力应该集中在鸟类上。1903年,莱特兄弟成功地制造了飞机。飞机的机身相对较薄,并且有两个突出的大飞翼,这一点都不奇怪。(见图1.1)
图1.1
盲目搜索算法不具备所必需的功能来应对人工智能领域出现的大规模的搜索问题。但是,人类是专家级别的“问题求解机器”。纽厄尔和西蒙认识到了这一特点,研究了在问题求解过程中被要求“说出自己思想”的人类。
1957年,这项研究最终导致了一般问题求解器(GPS)的发明。一般问题求解器具有从人类学科中提取出来的启发式,成功解决了以下问题:水壶问题、传教士和食人族问题以及康尼斯堡桥问题等。
1736年,莱昂哈德·欧拉写了关于图论的第一篇论文,给出这样的结论:当且仅当图17.3所示的桥包含了一个环,且这个环包含了所有的边和顶点时,图17.2所示的桥才可以如所描述的那样遍历。Euler得出结论,当且仅当每个顶点的度是偶数时,这个图才包含这样一个环(现在称为“欧拉环”)。
显然,问题的表示对于有效地发现解有着巨大的影响。上述指导原则带领我们得到了两种学习范式。人脑(和神经系统)是自然学习系统中最引人注目的例子。
第二个范式是进化,这也许不是那么明显。达尔文描述了植物和动物物种如何适应环境得以生存。在此处,是物种本身而不是个体在学习。第12章概述了两种进化学习方法—遗传算法和遗传规划。在从调度到优化的问题求解领域中,这两种方法都获得了成功。
普罗米修斯归来
在希腊神话中,普罗米修斯是个神,他从天庭中偷取火种,并把火种带到了人间。有些记述也赋予了他将人类从黏土中造出来的重任。在文学中,以无生命的材料创造生命的主题是普遍存在的。也许最令人毛骨悚然的描述出现在《Frankenstein》一书或玛丽·雪莱的小说《The Modern Prometheus》中。
毫无疑问,读者熟悉这个科学家创造生命然后对自己的创造物感到惊恐的故事。1931年,由詹姆斯·惠尔执导的电影中,鲍里斯·卡洛夫扮演了怪物的角色。
Shelly小说的第一版出版于1818年,当时工业革命正如火如荼地进行着。人类利用蒸汽动力在制造业和纺织业领域进行了翻天覆地的改革。电报的发明使远距离通信实际上变成了即时通信。
许多人认为这场革命的后遗症并不完全是有益的。我们对蒸汽和煤电,然后是石油,以及最近的核能的依赖,已经严重污染了星球、水体,还有空气。还有人认为,工业革命促进了堕落的物质主义。
文学评论家则非常深刻地指出,《弗兰肯斯坦》的道德是,社会必须警惕其试图掌控大自然的尝试。随着在整个21世纪,人们对智能知识的掌控持续增强,这也许需要不断向人工智能界强调这个警告。
其中一个作者(S. L.)在其童年时期看过这部电影:但是到了今天,他睡觉时仍然开着灯。
计算机科学是一门涉及信息和计算的科学领域。其重点是问题的算法解。20世纪让这个新生学科谦虚谨慎。由于人们发现了问题可解性的基本限制,因此这个学科就愈加谨慎起来。也就是说,可能存在一些问题,这些问题不存在算法解。著名的问题就是所谓的“停机问题”。
给定任意流程P,运行任意数据w,P(w)会暂停吗?例如,四色问题也许是图论中著名的开放性问题。它的命题是“对地图进行着色,四种颜色是否足以使两个相邻区域的颜色不一样?”1976年,阿佩尔和哈肯对这个问题做出了肯定的回答。
对于这个问题,计算机程序求解了几百个小时。如果运行这个程序的操作系统可以预测该程序最终会停止,那么这将大有裨益。停止问题告诉人们,这种先验知识并不总是可能的。
本书早些时候提到了阿兰·图灵。1936年,他正在研究什么样的函数是可计算的这个问题。例如,加法是一个可计算的函数,也就是说,可以给出一个逐步的过程,这样如果将整数X和Y作为输入,那么在有限的计算步骤之后,可以获得它们的和X + Y。
他提供了一个现在称为图灵机的计算模型(见图1.2)。图灵机由如下三部分组成。
(1)输入/输出磁带,在输入/输出磁带写上输入问题;同时在磁带上也写入了结果。存在各种图灵机模型;图1.2所示的是一种双向无界磁带的模型。磁带被分成了单元格,并且在每个单元格中都可以写入一个符号。磁带上的每个单元格预先加载了空白符号(B)。
(2)一种包含算法(即求解问题的分步过程)的有限控制。
(3)读/写头,这可以读取磁带上的符号,并将符号写入此磁带。它可以向左或向右移动。
图1.2 图灵机
Turling讨论了通用图灵机的概念—这种图灵机能够运行其他图灵机的程序,即能够模拟“普通”图灵机的行为。Turling证明,对于任意的图灵机(T),任意输入(w),即T(w),不可能确定图灵机(T)是否会停止。这就是所谓的图灵机停机问题。
这个问题更一般的版本(即停机问题),不能被证明是不可判定的。人们不假思索地接受了,图灵-邱奇论文给出的这个观点。这篇论文中提到,图灵机与数字计算机的计算能力相当,结果就是,大多数计算机科学家认为,在图灵机上无法解决的问题在算法上也是无法解决的。
因此,计算有根本的限制。作为计算机科学的子学科,人工智能也具有这些基本的限制。人们想知道的是,人类级别人工智能的创造是否也有这些限制。
人工智能的成果
我们回到创造人类级别人工智能的可行性。现在,我们简要介绍之前所描述的人工智能的成就。
搜索方面
视频游戏设计中已纳入了A*,这使游戏变得更加真实。
Mapquest、Google和Yahoo地图使用启发式搜索。许多GPS和智能手机应用程序都集成了这种技术。
用Hopfield网络和进化方法找到难题,有时甚至是NP完全问题(如TSP)的近似解。
博弈方面
Minimax评估使计算机可以玩比较简单的游戏,如tic-tac-toe和nim。
由启发式和其他机器学习工具辅助,通过alpha-beta修剪的Minimax评估使得计算机可以玩锦标赛级别的跳棋和国际象棋(Deeper Blue击败世界国际象棋冠军Garry Kasparov)。
锦标赛级别的奥赛罗程序(Logistello,1997),以及西洋双陆棋(TD-Gammon,1992)、桥牌(Jack和WBridge 5,2000s)和扑克中的“精通玩家”。
模糊逻辑方面
手持式摄像机自动补偿虚假的手部移动。
汽车牵引力控制装置。
数码相机、洗衣机和其他家用电器的控制装置。
专家系统方面
具有内置推理和解释性装置的知识密集型软件或所谓的专家系统(ES),可帮助消费者选择合适的车型、浏览在线网站、进行购物等。
ES还可用于分析、控制、诊断(患者有哪些疾病?)、指导和预测(我们应该在哪里挖石油?)。
ES用于多个领域,如药物、化学分析和计算机配置。
只要ES系统用于帮助而不是取代人类,将ES作为人工智能领域最大的成就之一就不会引起争议。
神经网络方面
雷克萨斯汽车有倒车摄像头、声纳设备和神经网络。采用这些技术,汽车可以自动并行停放。
当车辆太靠近其他车辆或物体时,梅赛德斯汽车以及其他汽车有自动停止控制。
Google汽车几乎完全自主,但是它自动驾驶时,车内必须有人。
光学字符读取器自动路由大量邮件。
自动语音识别系统得到广泛的应用。软件智能体例行公事地帮助我们浏览信用卡和银行交易。
在机场,当检测到在“禁飞”名单中的人时,软件会提供自动安全警报。
神经网络协助医学诊断和经济预测。
进化方法方面
电信卫星的轨道调度,防止通信渐隐消失。
优化天线和超大规模集成(VLSI)电路设计的软件。
数据挖掘软件使数据对公司更有价值。
自然语言处理(NLP)方面
会话智能体为个人提供旅游信息,并协助预约酒店等。
GPS系统通常向用户发出语音指令,例如“在下一个路口,左转”。一些智能手机具有应用程序,允许人们说出请求:“最近的能制作卡布奇诺的咖啡店在哪里?”
Web请求允许跨语言进行信息检索,并在需要时进行语言翻译。
交互式智能体向正在学习阅读的儿童提供口头协助。
具有神经网络、自然语言处理(见第13章)、语音理解和规划的机器学习应用程序,在机器人技术方面取得了显著的进步。
总体来说,对于一个开始其第二个50年发展的计算机科学子学科,来说这是一个不太糟的成绩。
应用之窗
1998年,斯坦福大学研究生拉里·佩奇和谢尔盖·布林创立了Google。Google最初是一个名为BackRub的搜索引擎,这个搜索引擎使用链接来评价网页的重要性。
Google搜索引擎是对“googol”这个词的戏称,但是获得了巨大的成功,并迅速成为地球上强大、知名和主流的搜索引擎。多年来,Google还开发了同样成功的电子邮件系统“Gmail”和大受欢迎的公共视频系统“YouTube”。 Google还开发了一款无人驾驶汽车。
Google无人驾驶汽车的工程师之一是德米特里·多尔戈夫,这个项目的负责人是塞巴斯蒂安·特伦博士。Thrun是斯坦福大学人工智能实验室的前任主管,并且是Google街景视图的共同发明人。
Google汽车已经测试了好几年,并且在未来的几年里,仍将继续以实验的形式呈现。虽然无人驾驶汽车看起来离大规模生产还需要几年的时间,但是技术人员认为,在不久的将来,它们将像手机和GPS系统一样受人欢迎。
Google认为这项技术可能多年无法盈利,但是在其他无人驾驶汽车制造商的信息和导航服务的可能销售中,Google可以预见到巨额利润。
Google汽车使用人工智能技术,如激光点标记感测附近任何事物的痕迹(如在地上的标记和标志),做出人类驾驶员应该做出的决定,如转向以避免障碍或看到行人时停车。
根据法律规定,为了防止出现问题,方向盘后必须有人,还需要技术人员监控导航系统,确保测试安全、不会发生事故。对于不同的驾驶员,你可以选择不同的驾驶个性,如“小心驾驶”“防守驾驶”和“积极驾驶”。
机器人的反应通常比人类快。基于感受器和设备,机器人能够全面感知。它也不会分心,也不会有通常会导致事故的其他因素,如疲劳、药物和粗心。工程师的目标是使这些无人驾驶汽车比人类更可靠。人为错误是造成许多事故的原因。
此外,这些无人驾驶汽车使用的软件必须经过仔细测试,必须没有病毒和恶意软件。其他关注点是燃油效率和空间效率——也就是说,理论上,无人驾驶汽车是不会发生事故的,所以汽车可能会“拥挤”在道路上。
一些Google无人驾驶汽车已经有了1600多千米的行驶记录,而且没有任何事故或人为干预。这些车辆经过少量的人为修正,也具有了十万多千米的行驶记录。
Google无人驾驶汽车的一个测试是在旧金山附近的校园外开始的。它在约182米的范围内使用了各种传感器,并遵循编入汽车的全球定位卫星系统或GPS的路线。这辆车在加利福尼亚州的规定速度下,以每小时约105千米的速度行驶。
就像人类一样,在转弯时,汽车变慢了,接下来加速了一点点。位于汽车顶部的设备提供了详细的环境及其周围情况的映射版本,因此它知道需要采用哪些路、哪些路要避开、哪些路是死路。
它能够在忙碌的高速公路上行驶几英里,并且可以无事故地离开高速公路。它也可以开车穿行,停在红灯和停止标志处,能够与行人互动。如果有人类出现,它会等待他们移动。它有一个语音系统,向车上的人或驾驶员宣布其动作。
当人工智能系统检测到传感器存在问题时,也会提醒驾驶员。它也可以防止事故,使用检测系统来指出发生了什么。驾驶员也可以通过按下右手附近的红色按钮、触摸制动器或转动方向盘来重新获得对汽车的控制。
当汽车无人驾驶,系统自动控制时,这称为巡航模式,此时,汽车里的人可以放开方向盘。实际上,它成了一种公共交通工具,无费用,不拥挤,不会东张西望且不会有其他因素(这些因素会令普通汽车司机感到分心)。
不过,这仍存在一些法律问题,例如,如果发生意外,谁将为之负责。所有允许无人驾驶汽车测试的州,在无人驾驶汽车时会发生事故的情况方面都没有制定相关的法律。Google发现,只要无人驾驶汽车的车辆内有人,这个人可以掌控任何可能发生的错误,那么驾驶无人汽车就是合法的。
Google汽车将减少对私家汽车的需求,从而减少交通流量,使得人们有了更多可用的土地,无须更广泛地铺设道路。
最近,Google一直在构建具有正常控制标准的实验性电动汽车,其除了启动和停止车辆之外,不需要驾驶员控制。人们可通过智能手机应用程序命令汽车自动驱动,到达需要它的人们的所在地,并将人带到目的地。
这辆汽车还发明了一个功能,就是所谓的交通堵塞辅助功能,这允许无人驾驶汽车在行驶过程中跟随另一辆车。
Google对无人驾驶汽车的计划是,拥有至少100台电力驱动的新型原型车。Google的团队将限定它们以约40千米/小时的速度在市区和郊区行驶。测试将由Google人员进行,这将有助于在狭小封闭的地区进行测试。很自然,这需要一段时间来说服监管机构,让他们接受人们使用无人驾驶汽车是安全的。
21世纪的人工智能
回到先前讨论中提出的悬而未决的问题:人类级别人工智能的创造是否会超出人工智能的基本界限?我们先来思考一下人类智力的起源,然后再思考一下生命本身的起源。
英国著名科学家理查德·道金斯解决了后一个问题,他在达尔文的进化论中找到了见解。当然,40亿年前,地球上没有动物或植物——只是基本原子的“原始汤”。
Dawkins认为,达尔文的理论可以推广到“稳定者生存”,换句话说,稳定的原子(和分子)更有可能在这个古老的地球上生存下去。他进一步推测,在早期的历史上,这个星球拥有丰富的水、二氧化碳、甲烷和氨,因此可能形成氨基酸(作为蛋白质的组成成分的复合分子)。
蛋白质是已知生命的前驱体。Dawkins设想,在这个星球漫长的生命之路上,下一步是所谓的“复制因子”的意外创造。这个复制因子具有一个显著的性质—能够忠实地复制自己。他认为,在这个原始环境中,能够快速准确地复制自己的复制因子是稳定的。
复制(或繁殖)过程本身需要有稳定的基本“原材料”的供给。毫无疑问,不同的复制因子不断竞争,以获得充分的水、二氧化碳、甲烷和氨的供给。这一进化过程持续了40亿年。Dawkins认为,经历了这个漫长的进化回合,在当今栖息在这个星球上的动植物中,我们可以找到继承者—这就是基因。
关于这个星球上可能的生命起源,Dawkins通过解释这些基因如何努力确保生存来继续其非凡的论述。在过去大约6亿年的时间里,它们的行为非常像虚构的精灵。
它们一直在塑造人类的眼睛、耳朵、肺等,生命之舟(即身体)也就从这些器官中构建而来。在这一论述中,动物的身体和植物好像只是保护所有重要基因生存的保护性隔断。最近,随着深入(SL)阅读Dawkins的作品,我的思绪回到了“星球大战”系列电影中的一个场景。
在这个场景中,敌方部队将士兵置于装有巨腿的机器人战斗机器中,这形成了士兵的保护壳。即使我们接受了Dawkins的理论,但还是有一个问题—“人类意识的起源在哪里?”
Dawkins可能会认为那些拥有意识的动物(再次通过自然选择产生的)将具有优势,因此可以实现相对的稳定性,从而确保生存。
杰拉德·埃德尔曼是一名生物学家,曾获得了诺贝尔奖。他提出了一种意识生物学理论,这个理论也建立在达尔文主义的基础上。他认为意识和心灵纯粹是生理现象。神经元组自组织成许多复杂和适应性强的模块。
Edelman认为,脑具有功能可塑性,也就是说,由于人类基因组没有足够的编码能力来完全指定脑结构,因此大量的脑组织是自我定向的。
在物理学中,统一场理论应该是关于一切事物的理论,这个理论试图将自然界中发生的各种力统一起来,例如重力、电磁力、强力和弱力。
Marvin Minsky在《Society of Mind》中解决了一个更为广泛的问题。他问:“大脑是如何组织的?”“认知是如何发生的?”正如Dawkins告诉我们的,人类的大脑是历经数亿年演变而来的。统一场理论无法简单直白地解释人类头骨内复杂器官的功能。
构建一种智慧好比组建一支没有指挥者的管弦乐队。其中,乐器就是智能体,它们不是在播放音乐,而是在解释世界。一些智能体有助于了解语言,另一些智能体可以解释视觉场景,还有一些智能体为人类提供了常识。
除非智能体之间能进行有效的通信,否则这一切毫无意义。Minsky假设,在任何时间点,个人的心理状态可以解释为一种功能,这个功能中的智能体子集是活跃的。也许人工智能还是太过年轻的一个领域,还没有准备好提出一个像Minsky这样的智能“统一场理论”。
但是,当人工智能成熟的时候,Minsky的《Society of Mind》可能会在其中发挥突出的作用。
2015年,在生物和化学层面上,人们完全了解了个体神经元的功能。在人类的知识中,依然存在的不足是,一群神经元如何处理感觉数据、编码经验、理解语言,以及在更一般意义上如何促进认知、启动意识。目前的研究使用X射线和其他扫描技术,在功能模块层面获得对大脑的理解。Kurzweil预测,到21世纪中叶,我们将对人类大脑有一个完整的、体系架构般的理解。
此外,他推测,计算机组件的小型化将会提升到一个新阶段,到那时,使用硬件来完全实现大脑是可行的——这种实现可能需要数十亿个人工神经元和数万亿甚至数十亿个神经元的连接。也许在那时,我们将有足够的力量来实现人类层次的人工智能。
对我们而言,比较明智的做法是记住普罗米修斯创造完全意识人类的“奖励”,即他被捆绑着,这样狮子就可以享用他的肝脏,然后他的肝脏再生,让狮子再次享用他的肝脏。
科幻文学概述了人类创造人类层次人工智能的无数情景。我们希望,如果人工智能可以永远遵循这个崇高的目标,那么这个奖励将比给普罗米修斯的“奖励”更令人满意。
[美] 史蒂芬·卢奇(Stephen Lucci) 著
美国经典入门教材,被誉为人工智能领域百科全书。人工智能领域近十年来最前沿教程,更加适合本科生使用。
本书基于人工智能的理论基础, 向读者展示全面、新颖、丰富多彩且易于理解的人工智能知识体系。本书给出诸多的示例、应用程序、全彩图片和人物轶事,以激发读者的阅读和学习兴趣;还引入了机器人和机器学习的相关高级课程,包括神经网络、遗传算法、自然语言处理、规划和复杂的棋盘博弈等。
扫码关注我们
点击阅读原文,直接购买《人工智能(第2版)》