备案控制台

开发者社区量子位文章正文

LeCun正面硬刚OpenAI黑箱优化论：最后没招了才干这个

2018-01-08 1030

版权

版权声明：

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本文来自AI新媒体量子位（QbitAI）

训练神经网络不是一件易事。

就算不考虑实现的难度，不计较计算力的使用，一切顺利的话可能也得几个小时才能搞定。所以OpenAI的研究人员最近发布了一个新思路。

他们制定了一个进化策略（别误会，这与生物进化关系不大），使用“黑箱”而不是通常的强化训练(通常基于梯度)。所谓“黑箱”，就是不管什么环境和神经网络，系统从许多随机参数开始，尝试然后继续尝试，最后找打理想的结果。

整个设置就是一大堆数字输入，然后输出一个数字，执果索因在上百万的数字里找到最好的配置。这是一个“猜测然后检测”的过程。

Andrej Karpathy参与的这项OpenAI论文声称：“黑箱”进化算法，可以与强化学习方法媲美，耗时更少而且代码简单。

对这个理论感兴趣的同学，请前往：https://arxiv.org/abs/1703.03864，以及：https://github.com/openai/evolution-strategies-starter 。

不过，这个理论遭遇Yann LeCun(杨立昆)的正面硬刚，LeCun大神说：

1、基于梯度的优化，远比黑箱优化更有效率

2、黑箱优化应该是最后的办法，无法基于梯度优化时才用

3、对于知道强化学习和黑箱优化的人来说，OpenAI这篇东西没什么用

截图为证，大家自行体会吧：

本文作者：若朴

原文发布时间： 2017-03-27

文章标签：

算法

机器学习/深度学习

关键词：

OpenAI优化

行者武松

目录

相关文章

1808090903196729

|

8月前

|

人工智能 JSON 机器人

[译][AI OpenAI-doc] 延迟优化

本指南涵盖了一系列核心原则，您可以应用这些原则来改善在各种LLM相关用例中的延迟。这些技术来自于与广泛的客户和开发人员在生产应用程序上的合作，因此无论您正在构建什么——从细粒度的工作流程到端到端的聊天机器人，都应该适用！

1808090903196729

106 0 0

[译][AI OpenAI-doc] 延迟优化

同学小张

|

8月前

|

人工智能 API Python

【AI大模型应用开发】1.1 Prompt Engineering（提示词工程）- 用OpenAI API实战，优化方法论总结

【AI大模型应用开发】1.1 Prompt Engineering（提示词工程）- 用OpenAI API实战，优化方法论总结

同学小张

385 0 0

行者武松

|

机器学习/深度学习算法机器人

OpenAI发布新强化学习算法：近端策略优化

行者武松

2003 0 0

云栖大讲堂

|

机器学习/深度学习人工智能算法

策略梯度下降过时了，OpenAI 拿出一种新的策略优化算法PPO

云栖大讲堂

1432 0 0

土木林森

|

3月前

|

机器学习/深度学习人工智能并行计算

"震撼！CLIP模型：OpenAI的跨模态奇迹，让图像与文字共舞，解锁AI理解新纪元！"

【10月更文挑战第14天】CLIP是由OpenAI在2021年推出的一种图像和文本联合表示学习模型，通过对比学习方法预训练，能有效理解图像与文本的关系。该模型由图像编码器和文本编码器组成，分别处理图像和文本数据，通过共享向量空间实现信息融合。CLIP利用大规模图像-文本对数据集进行训练，能够实现zero-shot图像分类、文本-图像检索等多种任务，展现出强大的跨模态理解能力。

土木林森

283 2 2

游客t3gydpdgxexoy

|

1月前

|

Go 开发工具

百炼-千问模型通过openai接口构建assistant 等 go语言

由于阿里百炼平台通义千问大模型没有完善的go语言兼容openapi示例，并且官方答复assistant是不兼容openapi sdk的。实际使用中发现是能够支持的，所以自己写了一个demo test示例，给大家做一个参考。

游客t3gydpdgxexoy

76 5 5

-编程工程师-

|

10天前

|

人工智能自然语言处理机器人

OpenAI推出具有图像上传和分析功能的完整o1模型，并首次推出ChatGPT Pro

OpenAI推出具有图像上传和分析功能的完整o1模型，并首次推出ChatGPT Pro

-编程工程师-

43 5 6

楠竹11

|

1月前

|

人工智能自然语言处理计算机视觉

OpenAI发布sCM提升50倍效率，扩散模型重大技术突破！

OpenAI近期发布了Simplified Consistency Models (sCM) 技术，这是在扩散模型基础上的重大改进，实现了50倍效率提升。sCM通过简化和稳定连续时间一致性模型的训练过程，解决了传统模型中的离散化误差和训练不稳定性问题，显著提升了生成模型的性能和效率。在多个数据集上的测试结果表明，sCM不仅超越了现有模型，还在生成模型的实际应用中展现了巨大潜力。论文地址：https://arxiv.org/abs/2410.11081

楠竹11

48 3 3

AIweker

|

4月前

|

机器学习/深度学习人工智能 UED

OpenAI o1模型：AI通用复杂推理的新篇章

OpenAI发布了其最新的AI模型——o1，这款模型以其独特的复杂推理能力和全新的训练方式，引起了业界的广泛关注。今天，我们就来深入剖析o1模型的特点、背后的原理，以及一些有趣的八卦信息。

AIweker

399 73 74

楠竹11

|

2月前

|

人工智能计算机视觉网络架构

OpenAI攻克扩散模型短板，清华校友路橙、宋飏合作最新论文

扩散模型在生成AI领域取得显著成果，但其训练不稳定性和采样速度慢限制了发展。OpenAI与清华校友合作，提出连续时间一致性模型（CMs），通过TrigFlow等创新解决了这些问题，大幅提升了训练稳定性和计算效率，实现了与最优模型相当的样本质量，同时减少了计算资源消耗。

楠竹11

47 2 2

量子位

热门文章

最新文章

OpenAI 12天发布会全解析 | AI大咖说

OpenAI 12天发布会内容全纪录！一文快速回顾获知亮点信息，原文附发布会中文字幕视频

从 OpenAI-o1 看大模型的复杂推理能力

openai 12天发布会收官 | AI大咖说

OpenAI Sora 怎么用：最新详细教程-新手小白必看｜ Sora 如何使用？(202412月最新更新)

NodeTool：AI 工作流可视化构建器，通过拖放节点设计复杂的工作流，集成 OpenAI 等多个平台

百炼-千问模型通过openai接口构建assistant 等 go语言

OpenAI API深度解析：参数、Token、计费与多种调用方式

OpenAI发布sCM提升50倍效率，扩散模型重大技术突破！

OpenAI又出王炸了！正式推出超强AI视频模型Sora

[译][AI OpenAI-doc] 安全最佳实践

[译][AI OpenAI-doc] 生产最佳实践

[译][AI OpenAI-doc] Prompt工程

这就是OpenAI神秘的Q*？斯坦福：语言模型就是Q函数

吴恩达 x Open AI ChatGPT ——如何写出好的提示词视频核心笔记

记录openai官网关于Setup your API key for a single project(为单个项目设置API 可以)的错误（2023/11/24）

[译][AI OpenAI-doc] 迁移指南 Beta

[译][AI OpenAI-doc] 函数调用 Beta

[译][AI OpenAI-doc] 代码解释器 Beta

[译][AI OpenAI-doc] 文件搜索 Beta

相关课程

更多

南瓜书《机器学习公式推导》

李宏毅2021《机器学习》

AI情绪鼓励师模型微调实操教学

【深度有趣】上海交大博士带你玩转GAN生成对抗网络

声纹识别技术

跨越N次元一键变身AI漫画人

相关电子书

更多

弱监督机器学习研究新进展

概率图模型

考察数据科学家支持向量机（SVM）知识的25道题，快来测测吧

相关实验场景

更多

奥运时刻！零代码生成奥运风格AI写真。

【AI破次元壁合照】少年白马醉春风，函数计算一键部署AI绘画平台

推荐系统入门之使用ALS算法实现打分预测

下一篇

阿里云无影云电脑免费试用，最长可试用3个月