Keras之父:大多数深度学习论文都是垃圾,炒作AI危害很大

简介: Keras之父、谷歌大脑人工智能和深度学习研究员François Chollet 近日接受采访,对自己的新书《Python深度学习》、Python为何广受欢迎、深度学习面临的挑战等议题进行回答。他认为,大多数深度学习论文都没有遵循科学的研究方法,并未产出有意义的新知识,学术界应该更严谨。

Keras之父、谷歌大脑人工智能和深度学习研究员François Chollet最新撰写了一本深度学习Python教程实战书籍《Python深度学习》,书中介绍了深度学习使用Python语言和强大Keras库,详实新颖。

近日,François Chollet接受了采访,就“深度学习到底是什么”、“Python为何如此广受欢迎”、“目前深度学习面临的主要挑战”等议题进行了回答。他认为,目前很多深度学习领域的论文都是无意义的,因为这些研究使用了不科学、不规范的研究方法。以下是采访全文编译。

关于本人

问:您主要的工作内容是什么?

答:我在谷歌大脑团队工作,花了很多时间开发Keras。我也参加TensorFlow的工作。最近我主要在写机器学习、计算机视觉、将深度学习应用于定理证明等方面的论文。我的主要研究兴趣是理解AI中的抽象和推理问题,如何从感知得到抽象的、高度概括的模型。

深度学习的本质、挑战、和未来

问:深度学习到底是什么?

答:深度学习是机器学习的一种具体方法。与以前的方法相比,它更加强大和灵活。在大多数应用程序中,我们所说的“深度学习”是指一种把大量由人类注释的数据转换为以与人类相似的方式自动注释新数据的软件。您可以通过这种方式自动完成很多不同的任务。深度学习尤其擅长理解“感知”数据,如图像、视频或声音。

我来举例说明。假设有很多图片都带有相关联标签(如“猫”、“狗”)。深度学习可以让你自动将数据转换到一个“了解”如何把图片映射到标签的系统,只需从示例中学习,无需任何手动调整或自定义工程。然后这种系统可以被应用到新的数据,将标记图片任务有效自动化。

同样,你可以将深度学习应用于机器翻译、语音识别、文本到语音转换,光学字符识别等问题。

问:深度学习社区现在面临的主要挑战是什么?

答:打击炒作、发展伦理意识、获得科学严谨性。

炒作:对人工智能的大肆炒作正在危害这个领域。一些人正荒谬地夸大目前AI取得的进展,还说人工智能已把人类逼到了绝境。但事实并非如此。如果我们把目标设得极高,却又不能实现,就是逼着公众站在我们的对立面上。而且,炒作AI这件事,本质上是不诚实的,对公众讨论也产生了危害。

伦理: 现在部署人工智能系统的大多数人来自单一背景,他们往往没有意识到自己所构建的系统给人们带来了道德影响和副作用。这将成为一个问题,因为这个群体所拥有的权力会越来越大。我们需要更多地讨论这些问题,并提高人们对不道德使用AI的潜在行为的觉察力,例如具有偏见性的预测模型会影响公众生活,或以危险的方式操纵AI。

科学: 每天都有大量的深度学习论文发表,其中大多数并没有真正产生任何有意义的新知识,因为这些论文没有遵循科学的研究方法。他们以模糊的方式“评估”模型,或者在他们的训练数据上测试过度拟合模型(尤其是生成模型和强化学习,这是深度学习研究中发展最快的两个主题),仅在MNIST上评估模型等。深度学习简直是科学的重灾区。同行评审通常不会以有意义的方式解决这些问题,也许部分原因是大多数同行评审员进入这个领域最多才一两年。如果想要取得更快的进展,那么当涉及研究可重复性、基线、模型评估和统计显著性时,我们需要更加严谨。我们目前的激励机制是与科学相对立的:发表论文是被鼓励的。如果你的研究听起来既复杂又神秘,很难被正确评估研究重要性,那么发表论文就容易多了。

问:你认为深度学习的未来是什么?

答:我期望AI未来能把“直观的”模式识别模块与正式推理模块相结合。我也希望AI能够演变得更像自动化软件开发的形式,借用目前软件工程中的很多模式和实践。

写书动机

问:你出版了一本新书《Python深度学习》。为什么要写这本书呢?

答:写这本书的原因是,我想推出一个课程,来教那些已有Python编程能力,但没有机器学习背景的人。

445c03a3f4b5dbf75801c320d8ac7f2a68615ae5

Python为何广受欢迎

问:Python应该是目前发展最快的编程语言,至少在高收入国家是这样。为什么Python如此受欢迎?

答:我爱Python。学习Python很容易上手,当你习惯使用它之后,会越来越高效。与我使用过的大多数其他语言相比,Python非常直观和优雅。但是Python真正的杀手锏并不在于语言本身,而是周围的生态系统和社区。无论你需要做什么,比如解析特定的文件格式或与特定系统连接,几乎有一个Python库在做这件事,你不必花时间去做。在数据科学和机器学习方面尤其如此,有很多很棒的工具:numpy,pandas,scikit-learn,plotting libraries等,这使得Python成为一种非常高效的语言。

我喜欢Python的另一个原因是,它并不是一个领域特定的语言,而是多领域的交叉点,从网站开发到数据科学和系统管理。这意味着无需切换到新语言来将Keras模型部署为Web API。无论你需要做什么,无论是启动一个web应用程序,查询一个REST API,还是解析一些文件,训练最先进的深度学习模型,Python通常都会是一个很好的选择。

给初学者的建议

问:有些声音认为进入机器学习有壁垒。您如何看待?

答:我不同意。在过去的5年中,进入机器学习领域变得非常容易。当然,5-7年前这很艰难。你可能需要研究生教育。你需要用C ++或Matlab来编写大量的低级算法。我经历过这些。而现在不一样了。你只需要Python,很容易上手,你有权限访问高级和易于使用的工具(如Keras)。另外,你可以在网上学到很多非常高质量的资源,你可以在Kaggle上练习现实世界的问题。学习从未如此简单。

问:对于初学者来说,最重要的是什么?

答:最重要的是要深刻了解深度学习能做什么,不能做什么。去感受一些best practice,比如如何正确评估模型,如何防止过度拟合。这需要把正式解释(formal explanations)和对现实问题的广泛实践结合起来。


原文发布时间为:2017-12-20

本文作者:常佩琦

本文来自云栖社区合作伙伴新智元,了解相关信息可以关注“AI_era”微信公众号

原文链接:Keras之父:大多数深度学习论文都是垃圾,炒作AI危害很大

相关文章
|
8月前
|
人工智能 物联网 调度
边缘大型AI模型:协作部署与物联网应用——论文阅读
论文《边缘大型AI模型:协作部署与物联网应用》系统探讨了将大模型(LAM)部署于边缘网络以赋能物联网的前沿框架。针对传统云端部署高延迟、隐私差的问题,提出“边缘LAM”新范式,通过联邦微调、专家混合与思维链推理等技术,实现低延迟、高隐私的分布式智能。
1299 6
边缘大型AI模型:协作部署与物联网应用——论文阅读
|
8月前
|
人工智能 量子技术
超越炒作:提示工程——与AI对话的艺术
超越炒作:提示工程——与AI对话的艺术
397 96
|
人工智能 数据可视化 数据挖掘
AI竟能独立完成顶会论文!The AI Scientist-v2:开源端到端AI自主科研系统,自动探索科学假设生成论文
The AI Scientist-v2 是由 Sakana AI 等机构开发的端到端自主科研系统,通过树搜索算法与视觉语言模型反馈实现科学假设生成、实验执行及论文撰写全流程自动化,其生成论文已通过国际顶会同行评审。
1425 34
AI竟能独立完成顶会论文!The AI Scientist-v2:开源端到端AI自主科研系统,自动探索科学假设生成论文
|
机器学习/深度学习 人工智能 自然语言处理
还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成文献综述
SurveyGO是清华与面壁智能联合开源的AI论文写作工具,采用LLMxMapReduce-V2技术实现文献智能聚合,能根据用户输入主题快速生成结构严谨、引用可靠的学术综述。
1761 1
还在想开题报告?SurveyGO卷姬:清华开源学术论文AI写作神器,一键生成文献综述
|
人工智能 自然语言处理 机器人
今日AI论文推荐:ReCamMaster、PLADIS、SmolDocling、FlowTok
由浙江大学、快手科技等机构提出的ReCamMaster是一个相机控制的生成式视频重渲染框架,可以使用新的相机轨迹重现输入视频的动态场景。该工作的核心创新在于利用预训练的文本到视频模型的生成能力,通过一种简单但强大的视频条件机制。为克服高质量训练数据的稀缺问题,研究者使用虚幻引擎5构建了一个全面的多相机同步视频数据集,涵盖多样化的场景和相机运动。
682 2
今日AI论文推荐:ReCamMaster、PLADIS、SmolDocling、FlowTok
|
9月前
|
机器学习/深度学习 人工智能 资源调度
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
本文探讨智能家居中AI决策的可解释性,提出以人为中心的XAI框架。通过SHAP、DeepLIFT等技术提升模型透明度,结合用户认知与需求,构建三层解释体系,增强信任与交互效能。
554 19
智能家居环境中的AI决策解释:实现以人为中心的可解释性——论文阅读
|
9月前
|
机器学习/深度学习 资源调度 算法框架/工具
AI-ANNE: 将神经网络迁移到微控制器的深度探索——论文阅读
AI-ANNE框架探索将深度学习模型迁移至微控制器的可行路径,基于MicroPython在Raspberry Pi Pico上实现神经网络核心组件,支持本地化推理,推动TinyML在边缘设备中的应用。
514 10
|
人工智能 安全 测试技术
本周 AI Benchmark 方向论文推荐
由北京大学和微软亚洲研究院的魏李等人提出的 FEA-Bench,是一个专为评估大型语言模型(LLMs)在代码库级别进行增量开发能力的基准测试。它从 83 个 GitHub 仓库中收集了 1,401 个任务实例,专注于新功能的实现。研究表明,即使是先进的 LLMs 在此任务中的表现仍远低于预期,揭示了仓库级代码开发的重大挑战。
857 0
|
9月前
|
人工智能 算法 开发者
2025年高教社杯E题——AI 辅助智能体测全国大学生数学建模(思路、代码、论文)
2025年高教社杯E题——AI 辅助智能体测全国大学生数学建模(思路、代码、论文)
720 1
|
人工智能 自然语言处理 算法
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留
BabelDOC 是一款专为科学论文设计的开源AI翻译工具,采用先进的无损解析技术和智能布局识别算法,能完美保留原文格式并生成双语对照翻译。
3117 67
科研论文翻译神器!BabelDOC:开源AI工具让PDF论文秒变双语对照,公式图表全保留