能否打开人工智能的“黑箱”?

简介:



Dean Pomerleau还记得自己第一次遭遇“黑箱”的经历。那是1991年,他当时正开创性尝试如今已是自动驾驶汽车研究中司空见惯的问题:教会电脑如何开车。


Pomerleau手握一辆经过特别改装的悍马军车的方向盘在城市中行驶。当时,他是美国卡内基·梅隆大学机器人专业的研究生。而与他同行的是一台经过其编程的计算机,能通过摄像机查看路况,解读交通状况,并记下Pomerleau对各种状况的应对方式。Pomerleau希望这台机器最终能自己掌握方向盘。


在每次行程中,Pomerleau都会先对系统做几分钟训练,然后让它自行驾驶。一切似乎都进展顺利,直到有一天,悍马在一座桥头突然偏向一侧。他敏捷地抓住了方向盘,这才避免了一场事故。


回到实验室,Pomerleau试图弄清电脑哪里出错了。“我论文的部分内容就是打开黑箱,搞清楚电脑在想什么。”他解释道。但该怎么做?他将计算机功能编程为“神经网络”—— 一种以大脑为原型的人工智能(AI),它有望比常规算法更适合应对复杂的现实情况。


不幸的是,神经网络和大脑一样是不透明的。它也没有将学到的东西条理清晰地储存在数字记忆中,而是以一种极难解的方式散布信息。在全面测试了软件对各种视觉刺激的反应后,Pomerleau才发现了问题:他的“神经网络”一直在使用长草的路沿作为道路方向的指示,所以才被桥的出现给迷惑了。


打开黑箱


25年后,破解黑箱的难度呈指数上升。但该AI技术本身的复杂性和应用范围也经历了爆炸式增长。现在,Pomerleau在卡内基·梅隆大学兼职教授机器人学,他说,比起今天的计算机上的巨型神经网络,他的系统只能算是个简陋的低配版。用海量数据训练AI深度学习的技术也已投入到各种商业应用,从自动驾驶汽车到根据用户的浏览历史推荐商品的网站,都能见到它的身影。


该技术还有望在科研中大显身手。未来的射电天文台也需要深度学习,寻找值得探测的信号,否则将无法处理海量信息;引力波探测器需要用它理解和排除最微弱的噪声源;出版商将会用它检索和标记数以百万计的研究论文和书籍。


一些研究者认为,能进行深度学习的计算机最终或能表现出想象力和创造力。“把数据交给机器,它便会推理出自然法则。”加州理工学院物理学家Jean-Roch Vlimant说。


但这些进展只会让黑箱问题显得更突出。例如,这些机器如何找到有价值的信号?人们怎样才能确定机器是对的?人们对深度学习的信任应到什么程度?


“在这些算法面前,我觉得我们正在丢失阵地。”哥伦比亚大学机器人专家Hod Lipson表示。他把这比作外星生物,它们不只看到红绿蓝三原色,还有第四种颜色,要想让人类理解它们看世界的方式,或是让外星人向人们解释其方式都非常困难。计算机向人们解释问题也面临类似困难。“在某种程度上,这就像向狗解释莎士比亚的作品一样。”


面对这些挑战,AI研究者采取了和Pomerleau一样的应对方式——打开黑箱,用相当于神经科学研究理解其中的网络。但欧洲核子研究中心(CERN)一位物理学家Vincenzo Innocente表示,答案无法让人豁然开朗。Innocente是在粒子物理学领域应用人工智能的先锋,他提到,“作为科学家,我对仅仅将小猫和小狗区分开来是不满意的,科学家会希望能说出区别到底在哪里。”


卷起袖子做硬科学


历史上第一个人工神经网络出现在上世纪50年代初,几乎与有能力执行算法的计算机同时产生。人工神经网络的思路是模拟排列成不同层次的小计算单元(也就是“神经元”)与大量数字“突触”相连。底层的单元会收集外部数据,然后将信息传递给下一层次的单元。这些单元随后会根据简单数学法则整合输入的数据,然后将结果向上传递。顶层最终会给出答案,比如判断图形到底是猫还是狗。


这类网络的优势在于其学习能力。有了附带正确答案的训练数据集,该网络便能调整每层连接的强度提升其表现,直到顶层的输出结果也是正确的。这一过程模拟了大脑通过强化或弱化突触学习的过程,最终得到能成功归类非训练集数据的网络。


但这种学习方式也是网络中信息分散的原因:就像人脑,记忆是在许多连接中编码的,而非储存在固定位置。“你手机号的第一位存在大脑的哪里?也许是在一堆突触中,也许离存储号码中其他数字的地方不远。”加州大学欧文分校机器学习专家Pierre Baldi说。


对需要在各自学科中处理大数据的科学家而言,这使得深度学习成了一种需谨慎使用的工具。为了理解原因,英国牛津大学计算机学家Andrea Vedaldi让人们想象这样的情景:在不久的将来,人们用乳房X光片训练深度学习网络。经过训练后,一位外表健康的女性的乳腺组织在机器“看来”或许已经有了患癌的迹象。“该网络或许暗中学会了辨认标志物能预测癌症。”他说。


但如果机器无法解释它是怎么知道的,Vedaldi说,就会给医生和病人带来严重困扰。对女性来说,因为会显著提升乳腺癌风险的遗传变异而选择乳房切除术已经够难了,但如果连风险因素是什么都不知道,做这样的选择就更困难了。


2012年,一些研究团队开始研究这类黑箱问题。加拿大多伦多大学机器学习专家Geoffrey Hinton,领导团队参加了一场计算机视觉竞赛,他们首次表明,从含有120万张图像的数据库中分类照片,深度学习法强于任何其他AI方法。


为了探索这一点是如何实现的,Vedaldi团队反向运行了Hinton的算法,使用了事先经过训练的网络,试图重建产生这些解读的图像。这有助于研究者识别出机器如何表现不同特征的。这就好像是在询问检测癌症的网络:“你认为这张乳房X光片上的哪个部分是癌症风险的标志物?”


不过,2014年,怀俄明大学计算机科学家Jeff Clune团队使用了能放大所有神经元、而不仅仅是顶层神经元反应的方法,并发现黑箱问题可能比人们之前所想的更为严重:神经网络很容易被在人类看来是随机噪声的图像,或是抽象的几何图形愚弄。

研究者提出了一些方法来解决愚弄问题,但目前还没有找到通用方法。在现实生活中,这很可能潜藏着危险。Clune说,尤为令人恐慌的是,黑客也能学会利用这些漏洞,他们可以让自动驾驶汽车认为广告牌是公路而一头撞上去。“我们得卷起袖子做硬科学研究,让机器学习更强大、更智能。”Clune总结道。


放开双手


去年,英国剑桥大学机器学习研究者Zoubin Ghahramani发表了一种能将数据科学家工作自动化的算法——从检查原始数据到写论文都能完成。该软件名叫自动统计学家,能发现数据集中的趋势和异常,呈现结论,其中还包括对推论方式的详细解释。Ghahramani提到,这样的透明度对科学应用来说是至关重要的,对许多商业应用也很重要。


但黑箱也会引发担忧。大数据公司Arundo Analytics的数据科学主管Ellie Dobson表示,许多机构都有类似的关注。例如,如果调整英国利率造成了什么不好的后果,“英格兰银行总不能说,‘是黑箱让我这么干的’。”她说。


计算机科学家认为,尽管存在种种担忧,但开发透明AI应被视为深度学习方法的补充,而不是替代。他们表示,一些透明方法或许适用于已经被描述为一系列抽象事实的问题,但并不适用于感知,也就是从原始数据中提取事实。


无论如何,这些研究人员指出,机器学习给出的复杂答案是必不可少的科学工具,因为真实世界就是非常复杂的。例如,对天气或是股票市场来说,综合、简化的描述可能并不存在。“有一些事情是无法用语言描述的。”巴黎综合理工学院的应用数学家Stéphane Mallat说,“如果你问医生是如何做诊断的,医生会告诉你一些理由,但人们为什么要用20年才能成为优秀的医生呢?因为信息不仅仅在书本中。”


Baldi认为,科学家应该拥抱深度学习技术,而不必太介意黑箱问题。毕竟,所有人的脑袋里都有一个黑箱。“人们一直在使用大脑,也始终相信大脑,但并不知道它是怎么工作的。"

原文发布时间为:2016-12-25


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
6月前
|
人工智能 算法 数据安全/隐私保护
AIGC变革下人工智能平台的算法黑箱问题
AIGC变革下人工智能平台的算法黑箱问题
321 1
AIGC变革下人工智能平台的算法黑箱问题
|
3天前
|
机器学习/深度学习 人工智能 算法
探索人工智能在图像处理中的应用
【10月更文挑战第32天】本文将深入探讨人工智能(AI)如何在图像处理领域大放异彩,从基础的图像识别到复杂的场景解析,AI技术正逐步改变我们对视觉信息的理解和应用。文章将通过具体案例,揭示AI如何优化图像质量、实现风格迁移和进行内容识别,进而讨论这些技术背后的挑战与未来发展方向。
|
4天前
|
机器学习/深度学习 人工智能 算法
人工智能在医疗诊断中的应用与前景
本文探讨了人工智能(AI)技术在医疗诊断领域的应用现状及其未来发展前景。通过分析AI技术如何辅助医生进行疾病诊断、提高诊断准确性和效率,以及面临的挑战和伦理问题,本文旨在为读者提供一个关于AI在医疗领域应用的全面视角。
|
5天前
|
机器学习/深度学习 人工智能 监控
人工智能在医疗健康领域的创新应用
本文旨在探讨人工智能技术在医疗健康领域的创新应用。通过分析AI如何助力疾病诊断、治疗计划制定、患者监护以及药物研发,本文揭示了AI技术为现代医疗服务带来的革命性变化。此外,文章还讨论了实施这些技术时面临的挑战和未来发展趋势,为医疗行业的数字化转型提供了深入见解。
|
6天前
|
人工智能 自然语言处理 自动驾驶
深入理解ChatGPT:下一代人工智能助手的开发与应用
【10月更文挑战第27天】本文深入探讨了ChatGPT的技术原理、开发技巧和应用场景,展示了其在语言理解和生成方面的强大能力。文章介绍了基于Transformer的架构、预训练与微调技术,以及如何定制化开发、确保安全性和支持多语言。通过实用工具如GPT-3 API和Fine-tuning as a Service,开发者可以轻松集成ChatGPT。未来,ChatGPT有望在智能家居、自动驾驶等领域发挥更大作用,推动人工智能技术的发展。
|
8天前
|
机器学习/深度学习 人工智能 搜索推荐
探索人工智能在医疗健康领域的应用
【10月更文挑战第25天】 本文深入探讨了人工智能(AI)技术在医疗健康领域的现状与未来趋势。通过对AI技术在疾病诊断、治疗方案优化、患者管理等方面的应用案例分析,揭示了AI如何助力提高医疗服务效率和质量。文章还讨论了AI技术面临的挑战,包括数据安全、伦理问题以及技术普及的障碍,并提出了相应的解决策略。通过本文,读者将对AI在医疗健康领域的潜力和挑战有一个全面的认识。
34 2
|
9天前
|
机器学习/深度学习 人工智能 自然语言处理
探索人工智能的无限可能:技术前沿与应用实践
【10月更文挑战第23天】探索人工智能的无限可能:技术前沿与应用实践
|
13天前
|
机器学习/深度学习 人工智能 算法
人工智能在医疗诊断中的应用及其挑战
【10月更文挑战第22天】人工智能技术正逐渐渗透到我们生活的方方面面,尤其是在医疗领域,它展现出了巨大的潜力。从辅助医生进行疾病诊断到预测患者病情的发展,AI的应用正在改变着传统的医疗模式。然而,随之而来的是一系列挑战,包括数据隐私、算法偏见以及医患关系的重新定位等问题。本文将探讨AI在医疗诊断中的应用实例,并分析面临的主要挑战,以期对未来的医疗AI应用提供深入的见解和建议。
|
13天前
|
传感器 人工智能 自动驾驶
人工智能在自动驾驶汽车中的应用
【10月更文挑战第31天】人工智能在自动驾驶汽车中的应用是科技进步与汽车产业转型的产物。通过计算机视觉、雷达、LiDAR和超声波传感器等技术,自动驾驶汽车实现了精准感知;借助复杂AI算法,实现决策与控制、路径规划与导航。尽管面临技术成熟度、法规与伦理、公众接受度等挑战,但未来自动驾驶汽车有望在全球范围内实现商业化普及,彻底改变出行方式,提高道路安全,减少交通拥堵,促进绿色出行。

热门文章

最新文章