6.23 Yoshua Bengio: 深度学习崛起带来人工智能的春天
20 世纪 50 年代,计算机开始在象棋领域战胜人类,证明数学定理,让人类狂喜不已。60 年代,人们越来越希望,不久以后,科学家就能用硬件和软件复制人类大脑,“人工智能”可以完成任何任务,其表现不逊于人类。1967 年,今年年初逝世的麻省理工学院教授 Marvin Minsky(MIT 人工智能实验室的联合创始人,人工智能先驱)宣称,十年之内,人们可以解决人工智能这个难题。
当然,结果表明,当时就持有那份乐观主义,有些过早。被设计用来协助外科医生更好诊断病人的软件,以及模拟人类大脑、用来识别图片内容的网络,都辜负了人工智能发展初期的那份狂热。早些年,人工智能算法并不成熟,所需数据也比当时可以提供的数据还要多。计算机处理过程也很慢,以至于无法驱动计算机完成接近人类思维复杂性的大规模运算。
到了 21 世纪中期,打造媲美人类智能水平的机器之梦,几乎从科学界消失了。当时,甚至“人工智能(AI)”这一表达,都不再是严肃科学领域的用语。20 世纪 70 年代到 21 世纪中期,这段希望破灭时期,被科学家和作家们形容为一连串的“人工智能之冬”。
十年能发生多大的变化啊。2005 年初,人工智能的前景发生了引人注目的改变。当时,深度学习,这种灵感源自脑科学、打造智能机器的方法,开始取得成功。近些年来,深度学习已经成为推动人工智能研究向前的奇特(singular)力量。现在,一些主要的信息技术公司也正投入数十亿美元,发展深度学习技术。
深度学习,是指模拟神经网络,自己逐渐“学会”识别图像,理解语音甚至做出决策。这一技术依赖的是所谓的人工神经网络——目前人工智能研究的核心部分。人工神经网络,并不是精确模拟真实的神经元运作方式。而是以一般数学原理为基础,这些数学原理能够帮助网络从实例中学习,识别出图片中的物体或人,翻译世界主要语言。深度学习技术,已经变革了人工智能研究,重拾对计算机视觉、语音识别、自然语言处理以及机器人学的雄心。
2012 年,首次展示了第一款用于理解语音的人工智能产品——你可能对 GoogleNow 比较熟悉。紧接着,又出现了可以识别图片内容的应用,这一功能已经被吸收到谷歌相册的搜索引擎中。任何一个对繁冗的自动手机菜单感到沮丧的人都能体会,一款更好的智能手机私人助理会让操作变得多么便利。有些人记得几年前,在识别图片中的物体方面,人工智能的表现有多糟糕——当时的软件可能会把无生命的物品识别成动物——在这些人看来,计算机视觉上的进步,难以置信:在一定条件下,现在的计算机可以识别出猫、势头或者脸部以及人。现在,人工智能软件实际上已经成为数百万智能手机用户的生活的一部分。
就我个人而言,已经很少手动键入信息,而是直接对手机说出命令,有时候它甚至能给我反馈。这些进步已经突然为技术的进一步商业化打开了大门,而且兴奋度也有增无减。公司的人才争夺战也十分激烈,深度学习领域的博士极度供不应求。许多该领域的大学教授——据某些统计,是大部分教授——都从学术界跳槽到了产业中,公司为他们配备了齐全的研究设备,还有丰厚的薪资。解决深度学习的难题,已经带来让人吃惊的成功。
神经网络击败顶尖围棋选手李世石的消息,登上了新闻头条。相关应用已经延伸到其他人类专长的领域——而且这还不是游戏的全部。一项新研发的深度学习算法,旨在根据磁共振成像诊断心脏衰竭,就像心脏病专家那样。