Keras之父:大多数深度学习论文都是垃圾,炒作AI危害很大

简介: Keras之父、谷歌大脑人工智能和深度学习研究员François Chollet 近日接受采访,对自己的新书《Python深度学习》、Python为何广受欢迎、深度学习面临的挑战等议题进行回答。他认为,大多数深度学习论文都没有遵循科学的研究方法,并未产出有意义的新知识,学术界应该更严谨。

Keras之父、谷歌大脑人工智能和深度学习研究员François Chollet最新撰写了一本深度学习Python教程实战书籍《Python深度学习》,书中介绍了深度学习使用Python语言和强大Keras库,详实新颖。

近日,François Chollet接受了采访,就“深度学习到底是什么”、“Python为何如此广受欢迎”、“目前深度学习面临的主要挑战”等议题进行了回答。他认为,目前很多深度学习领域的论文都是无意义的,因为这些研究使用了不科学、不规范的研究方法。以下是采访全文编译。

关于本人

问:您主要的工作内容是什么?

答:我在谷歌大脑团队工作,花了很多时间开发Keras。我也参加TensorFlow的工作。最近我主要在写机器学习、计算机视觉、将深度学习应用于定理证明等方面的论文。我的主要研究兴趣是理解AI中的抽象和推理问题,如何从感知得到抽象的、高度概括的模型。

深度学习的本质、挑战、和未来

问:深度学习到底是什么?

答:深度学习是机器学习的一种具体方法。与以前的方法相比,它更加强大和灵活。在大多数应用程序中,我们所说的“深度学习”是指一种把大量由人类注释的数据转换为以与人类相似的方式自动注释新数据的软件。您可以通过这种方式自动完成很多不同的任务。深度学习尤其擅长理解“感知”数据,如图像、视频或声音。

我来举例说明。假设有很多图片都带有相关联标签(如“猫”、“狗”)。深度学习可以让你自动将数据转换到一个“了解”如何把图片映射到标签的系统,只需从示例中学习,无需任何手动调整或自定义工程。然后这种系统可以被应用到新的数据,将标记图片任务有效自动化。

同样,你可以将深度学习应用于机器翻译、语音识别、文本到语音转换,光学字符识别等问题。

问:深度学习社区现在面临的主要挑战是什么?

答:打击炒作、发展伦理意识、获得科学严谨性。

炒作:对人工智能的大肆炒作正在危害这个领域。一些人正荒谬地夸大目前AI取得的进展,还说人工智能已把人类逼到了绝境。但事实并非如此。如果我们把目标设得极高,却又不能实现,就是逼着公众站在我们的对立面上。而且,炒作AI这件事,本质上是不诚实的,对公众讨论也产生了危害。

伦理: 现在部署人工智能系统的大多数人来自单一背景,他们往往没有意识到自己所构建的系统给人们带来了道德影响和副作用。这将成为一个问题,因为这个群体所拥有的权力会越来越大。我们需要更多地讨论这些问题,并提高人们对不道德使用AI的潜在行为的觉察力,例如具有偏见性的预测模型会影响公众生活,或以危险的方式操纵AI。

科学: 每天都有大量的深度学习论文发表,其中大多数并没有真正产生任何有意义的新知识,因为这些论文没有遵循科学的研究方法。他们以模糊的方式“评估”模型,或者在他们的训练数据上测试过度拟合模型(尤其是生成模型和强化学习,这是深度学习研究中发展最快的两个主题),仅在MNIST上评估模型等。深度学习简直是科学的重灾区。同行评审通常不会以有意义的方式解决这些问题,也许部分原因是大多数同行评审员进入这个领域最多才一两年。如果想要取得更快的进展,那么当涉及研究可重复性、基线、模型评估和统计显著性时,我们需要更加严谨。我们目前的激励机制是与科学相对立的:发表论文是被鼓励的。如果你的研究听起来既复杂又神秘,很难被正确评估研究重要性,那么发表论文就容易多了。

问:你认为深度学习的未来是什么?

答:我期望AI未来能把“直观的”模式识别模块与正式推理模块相结合。我也希望AI能够演变得更像自动化软件开发的形式,借用目前软件工程中的很多模式和实践。

写书动机

问:你出版了一本新书《Python深度学习》。为什么要写这本书呢?

答:写这本书的原因是,我想推出一个课程,来教那些已有Python编程能力,但没有机器学习背景的人。

445c03a3f4b5dbf75801c320d8ac7f2a68615ae5

Python为何广受欢迎

问:Python应该是目前发展最快的编程语言,至少在高收入国家是这样。为什么Python如此受欢迎?

答:我爱Python。学习Python很容易上手,当你习惯使用它之后,会越来越高效。与我使用过的大多数其他语言相比,Python非常直观和优雅。但是Python真正的杀手锏并不在于语言本身,而是周围的生态系统和社区。无论你需要做什么,比如解析特定的文件格式或与特定系统连接,几乎有一个Python库在做这件事,你不必花时间去做。在数据科学和机器学习方面尤其如此,有很多很棒的工具:numpy,pandas,scikit-learn,plotting libraries等,这使得Python成为一种非常高效的语言。

我喜欢Python的另一个原因是,它并不是一个领域特定的语言,而是多领域的交叉点,从网站开发到数据科学和系统管理。这意味着无需切换到新语言来将Keras模型部署为Web API。无论你需要做什么,无论是启动一个web应用程序,查询一个REST API,还是解析一些文件,训练最先进的深度学习模型,Python通常都会是一个很好的选择。

给初学者的建议

问:有些声音认为进入机器学习有壁垒。您如何看待?

答:我不同意。在过去的5年中,进入机器学习领域变得非常容易。当然,5-7年前这很艰难。你可能需要研究生教育。你需要用C ++或Matlab来编写大量的低级算法。我经历过这些。而现在不一样了。你只需要Python,很容易上手,你有权限访问高级和易于使用的工具(如Keras)。另外,你可以在网上学到很多非常高质量的资源,你可以在Kaggle上练习现实世界的问题。学习从未如此简单。

问:对于初学者来说,最重要的是什么?

答:最重要的是要深刻了解深度学习能做什么,不能做什么。去感受一些best practice,比如如何正确评估模型,如何防止过度拟合。这需要把正式解释(formal explanations)和对现实问题的广泛实践结合起来。


原文发布时间为:2017-12-20

本文作者:常佩琦

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:Keras之父:大多数深度学习论文都是垃圾,炒作AI危害很大

相关文章
|
机器学习/深度学习 人工智能 安全
探索AI的未来:从机器学习到深度学习
【10月更文挑战第28天】本文将带你走进AI的世界,从机器学习的基本概念到深度学习的复杂应用,我们将一起探索AI的未来。你将了解到AI如何改变我们的生活,以及它在未来可能带来的影响。无论你是AI专家还是初学者,这篇文章都将为你提供新的视角和思考。让我们一起探索AI的奥秘,看看它将如何塑造我们的未来。
449 3
|
9月前
|
机器学习/深度学习 人工智能 供应链
从概念到商业价值:AI、机器学习与深度学习全景指南
在这个科技飞速发展的时代🚀,人工智能正以惊人的速度渗透到我们的生活和工作中👀。但面对铺天盖地的AI术语和概念,很多人感到困惑不已😣。"AI"、"机器学习"、"深度学习"和"神经网络"到底有什么区别?它们如何相互关联?如何利用这些技术提升工作效率和创造价值?
487 0
|
7月前
|
机器学习/深度学习 人工智能 PyTorch
AI 基础知识从 0.2 到 0.3——构建你的第一个深度学习模型
本文以 MNIST 手写数字识别为切入点,介绍了深度学习的基本原理与实现流程,帮助读者建立起对神经网络建模过程的系统性理解。
737 15
AI 基础知识从 0.2 到 0.3——构建你的第一个深度学习模型
|
7月前
|
机器学习/深度学习 人工智能 自然语言处理
AI 基础知识从 0.3 到 0.4——如何选对深度学习模型?
本系列文章从机器学习基础出发,逐步深入至深度学习与Transformer模型,探讨AI关键技术原理及应用。内容涵盖模型架构解析、典型模型对比、预训练与微调策略,并结合Hugging Face平台进行实战演示,适合初学者与开发者系统学习AI核心知识。
584 15
|
10月前
|
机器学习/深度学习 人工智能 运维
AI“捕风捉影”:深度学习如何让网络事件检测更智能?
AI“捕风捉影”:深度学习如何让网络事件检测更智能?
413 8
|
12月前
|
传感器 人工智能 机器人
【01】人形机器人研究试验-被有些网友痛骂“工业垃圾”“人工智障”上春晚的人形AI机器人-宇树科技机器人到底怎么样??-本系列优雅草卓伊凡亲自尝试下人形机器人的制造-从0开始学习并且制作机器人-可以跟随卓伊凡
【01】人形机器人研究试验-被有些网友痛骂“工业垃圾”“人工智障”上春晚的人形AI机器人-宇树科技机器人到底怎么样??-本系列优雅草卓伊凡亲自尝试下人形机器人的制造-从0开始学习并且制作机器人-可以跟随卓伊凡
731 1
【01】人形机器人研究试验-被有些网友痛骂“工业垃圾”“人工智障”上春晚的人形AI机器人-宇树科技机器人到底怎么样??-本系列优雅草卓伊凡亲自尝试下人形机器人的制造-从0开始学习并且制作机器人-可以跟随卓伊凡
|
12月前
|
机器学习/深度学习 PyTorch TensorFlow
深度学习工具和框架详细指南:PyTorch、TensorFlow、Keras
在深度学习的世界中,PyTorch、TensorFlow和Keras是最受欢迎的工具和框架,它们为研究者和开发者提供了强大且易于使用的接口。在本文中,我们将深入探索这三个框架,涵盖如何用它们实现经典深度学习模型,并通过代码实例详细讲解这些工具的使用方法。
1080 0
|
机器学习/深度学习 人工智能 算法
基于深度学习的地面垃圾识别分类技术
AI垃圾分类系统结合深度学习和计算机视觉技术,实现高效、精准的垃圾识别与自动分类。系统集成高精度图像识别、多模态数据分析和实时处理技术,适用于市政环卫、垃圾处理厂和智能回收设备,显著提升管理效率,降低人工成本。
1228 1
基于深度学习的地面垃圾识别分类技术
|
机器学习/深度学习 人工智能 自然语言处理
揭秘AI:深度学习的奥秘与实践
本文将深入浅出地探讨人工智能中的一个重要分支——深度学习。我们将从基础概念出发,逐步揭示深度学习的原理和工作机制。通过生动的比喻和实际代码示例,本文旨在帮助初学者理解并应用深度学习技术,开启AI之旅。
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络
垃圾识别分类系统。本系统采用Python作为主要编程语言,通过收集了5种常见的垃圾数据集('塑料', '玻璃', '纸张', '纸板', '金属'),然后基于TensorFlow搭建卷积神经网络算法模型,通过对图像数据集进行多轮迭代训练,最后得到一个识别精度较高的模型文件。然后使用Django搭建Web网页端可视化操作界面,实现用户在网页端上传一张垃圾图片识别其名称。
570 0
基于Python深度学习的【垃圾识别系统】实现~TensorFlow+人工智能+算法网络