清华人工智能研究院院长张钹:深度学习的钥匙丢在黑暗角落

简介: 近日,中国科学院院士、清华大学人工智能研究院院长张钹在一次学术活动中阐述深度学习方法易受欺骗、易受攻击的根本原因。

云栖号:https://yqh.aliyun.com

第一手的上云资讯,不同行业精选的上云企业案例库,基于众多成功案例萃取而成的最佳实践,助力您上云决策!


image


清华大学人工智能研究院院长张钹

“常常有比喻说,钥匙并不丢在这个地方,大家为什么都在这个地方找钥匙呢?因为这个地方灯亮看得见。真正的钥匙丢在黑暗的角落里,那里不好找,一时半会写不了文章,所以好多人不愿意去找。”
近日,中国科学院院士、清华大学人工智能研究院院长张钹在一次学术活动中阐述深度学习方法易受欺骗、易受攻击的根本原因。他提出,根本解决办法并不在“灯亮看得见”的深度学习模型的修修补补上,而应该向人类学习。学习的内容包括,一、改变深度学习网络的模型与结构;二、在数据驱动的基础上引进知识。
张钹,清华大学计算机系教授,中国科学院院士,1958年毕业于清华大学自动控制系。他参与人工智能、人工神经网络、机器学习等理论研究,以及这些理论应用于模式识别、知识工程与机器人等技术研究。

从“让数据说话”到引入知识

数据、算法、算力通常被认为是深度学习时代驱动人工智能崛起的三大因素。
但张钹认为,知识与这三者同样重要,共同组成人工智能的四大基础。“回顾人工智能的历史,可以看到这四个因素不断地发挥作用。”
1月11日,张钹在清华-中国工程院知识智能联合研究中心年会暨认知智能高峰论坛上提出上述观点。
张钹介绍,第一代人工智能即符号主义主导的人工智能时代强调知识对智能的作用,由于当时受算法和算力的限制,知识表示依赖人工编程,因而以知识为基础的推理模型没有得到大量推广。
深度学习兴起之后,学界将目标转移至数据,提出“让数据说话”。张钹认为,这种强调对深度学习的发展起到积极的作用,但也有“很大的不足”:过分强调数量的重要性,片面认为“质量差没关系,数据多就可以解决问题”。
“这导致按照大数据建起来的人工智能系统面临不可信、不可靠、不安全、不易推广的挑战”。
在他看来,解决这个挑战的办法之一是引入知识。
“这也是我们人工智能研究院所提倡的第三代人工智能的道路——通过数据驱动和知识驱动的结合克服第一代和第二代人工智能的不足。

“钥匙丢在黑暗的角落里”

深度学习应用于模式识别虽然可以在大数据的训练中学到正确的分类,却很容易受到恶意干扰、欺骗和攻击。将狮子识别为图书馆、把雪山认作一只狗、停止标志识别被当成限速标志……此类深度学习系统被“忽悠”的案例层出不穷,如果发生在自动驾驶场景,就可能产生严重后果。
面对深度学习的脆弱性,单纯从深度学习网络上修修补补只能治标,不能治本。
张钹在回答现场观众提问时表示,“深度学习不能提取出语义层面的特征,只能提取底层特征,这是它脆弱、易受攻击的根本原因。如果不解决这个问题,只靠修修补补,不能根本解决问题,现在的很多做法就是如此。”
如何根本解决深度学习存在的问题?
张钹认为,有两个工作可以做:一是学习人类神经网络的结构,结合脑科学以改进深度学习模型,二是将知识驱动与数据驱动结合起来。“前者涉及学科交叉更难一点,搞计算机的大多数选择后一条路”。
走第二条路的关键问题是如何从原始数据中自动提取知识。“这一直做不好,因为知识很难自动获取,需要依赖人工,单纯依赖人工是走不远的”。他鼓励人工智能研究者重点在知识获取方面做工作,“如果这个问题解决了,很多问题将迎刃而解。”

原文发布时间:2020-01-16

本文作者:张唯

本文来自阿里云云栖号合作伙伴“渠道(链接)”,了解相关信息可以关注“渠道(链接)”

相关文章
|
14天前
|
机器学习/深度学习 人工智能 安全
探索AI的未来:从机器学习到深度学习
【10月更文挑战第28天】本文将带你走进AI的世界,从机器学习的基本概念到深度学习的复杂应用,我们将一起探索AI的未来。你将了解到AI如何改变我们的生活,以及它在未来可能带来的影响。无论你是AI专家还是初学者,这篇文章都将为你提供新的视角和思考。让我们一起探索AI的奥秘,看看它将如何塑造我们的未来。
50 3
|
3天前
|
机器学习/深度学习 人工智能 TensorFlow
人工智能浪潮下的自我修养:从Python编程入门到深度学习实践
【10月更文挑战第39天】本文旨在为初学者提供一条清晰的道路,从Python基础语法的掌握到深度学习领域的探索。我们将通过简明扼要的语言和实际代码示例,引导读者逐步构建起对人工智能技术的理解和应用能力。文章不仅涵盖Python编程的基础,还将深入探讨深度学习的核心概念、工具和实战技巧,帮助读者在AI的浪潮中找到自己的位置。
|
16天前
|
机器学习/深度学习 数据采集 人工智能
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】随着人工智能的发展,深度学习技术正逐步应用于教育领域,特别是个性化学习系统中。通过分析学生的学习数据,深度学习模型能够精准预测学生的学习表现,并为其推荐合适的学习资源和规划学习路径,从而提供更加高效、有趣和个性化的学习体验。
71 9
|
6天前
|
机器学习/深度学习 人工智能 自然语言处理
人工智能与深度学习:探索未来技术的无限可能
在21世纪,人工智能(AI)和深度学习已经成为推动科技进步的重要力量。本文将深入探讨这两种技术的基本概念、发展历程以及它们如何共同塑造未来的科技景观。我们将分析人工智能的最新趋势,包括自然语言处理、计算机视觉和强化学习,并讨论这些技术在现实世界中的应用。此外,我们还将探讨深度学习的工作原理,包括神经网络、卷积神经网络(CNN)和循环神经网络(RNN),并分析这些模型如何帮助解决复杂的问题。通过本文,读者将对人工智能和深度学习有更深入的了解,并能够预见这些技术将如何继续影响我们的世界。
32 7
|
3天前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
垃圾识别分类系统。本系统采用Python作为主要编程语言,通过收集了5种常见的垃圾数据集('塑料', '玻璃', '纸张', '纸板', '金属'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对图像数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。然后使用Django搭建Web网页端可视化操作界面,实现用户在网页端上传一张垃圾图片识别其名称。
20 0
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
|
4天前
|
机器学习/深度学习 人工智能 算法
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
手写数字识别系统,使用Python作为主要开发语言,基于深度学习TensorFlow框架,搭建卷积神经网络算法。并通过对数据集进行训练,最后得到一个识别精度较高的模型。并基于Flask框架,开发网页端操作平台,实现用户上传一张图片识别其名称。
16 0
【手写数字识别】Python+深度学习+机器学习+人工智能+TensorFlow+算法模型
|
4天前
|
机器学习/深度学习 人工智能 算法
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
蔬菜识别系统,本系统使用Python作为主要编程语言,通过收集了8种常见的蔬菜图像数据集('土豆', '大白菜', '大葱', '莲藕', '菠菜', '西红柿', '韭菜', '黄瓜'),然后基于TensorFlow搭建卷积神经网络算法模型,通过多轮迭代训练最后得到一个识别精度较高的模型文件。在使用Django开发web网页端操作界面,实现用户上传一张蔬菜图片识别其名称。
16 0
基于深度学习的【蔬菜识别】系统实现~Python+人工智能+TensorFlow+算法模型
|
15天前
|
机器学习/深度学习 算法 编译器
Python程序到计算图一键转化,详解清华开源深度学习编译器MagPy
【10月更文挑战第26天】MagPy是一款由清华大学研发的开源深度学习编译器,可将Python程序一键转化为计算图,简化模型构建和优化过程。它支持多种深度学习框架,具备自动化、灵活性、优化性能好和易于扩展等特点,适用于模型构建、迁移、部署及教学研究。尽管MagPy具有诸多优势,但在算子支持、优化策略等方面仍面临挑战。
41 3
|
15天前
|
机器学习/深度学习 人工智能 算法
AI在医疗:深度学习在医学影像诊断中的最新进展
【10月更文挑战第27天】本文探讨了深度学习技术在医学影像诊断中的最新进展,特别是在卷积神经网络(CNN)的应用。文章介绍了深度学习在识别肿瘤、病变等方面的优势,并提供了一个简单的Python代码示例,展示如何准备医学影像数据集。同时强调了数据隐私和伦理的重要性,展望了AI在医疗领域的未来前景。
37 2
|
17天前
|
机器学习/深度学习 人工智能 物联网
深度学习:物联网大数据洞察中的人工智能
深度学习:物联网大数据洞察中的人工智能