[译][AI Research] AI 模型中的“it”是数据集

简介: 模型效果的好坏,最重要的是数据集,而不是架构,超参数,优化器。

模型效果的好坏,最重要的是数据集,而不是架构,超参数,优化器。


我现在已经在 OpenAI 工作了将近一年。在这段时间里,我训练了很多生成模型。比起任何人都有权利训练的要多。当我花费这些时间观察调整各种模型配置和超参数的效果时,有一件事让我印象深刻,那就是所有训练运行之间的相似之处。

我越来越清楚地认识到,这些模型确实以令人难以置信的程度逼近它们的数据集。这意味着它们不仅学会了什么是狗或猫,还学会了不重要的分布之间的插值频率,比如人类可能拍摄的照片或人类常写下的单词。

这表现为 - 长时间训练在相同数据集上,几乎每个具有足够权重和训练时间的模型都会收敛到相同的点。足够大的扩散卷积-联合产生与 ViT 生成器相同的图像。AR 抽样产生与扩散相同的图像。

这是一个令人惊讶的观察!它意味着模型行为不是由架构、超参数或优化器选择确定的。它是由您的数据集确定的,没有别的。其他一切都是为了高效地将计算逼近该数据集而采取的手段。

那么,当您提到“Lambda”、“ChatGPT”、“Bard”或“Claude”时,您所指的不是模型权重。而是数据集。


相关文章
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
当大火的文图生成模型遇见知识图谱,AI画像趋近于真实世界
本文介绍了阿里云机器学习PAI团队开发的名为ARTIST的中文文图生成模型,该模型融合了知识图谱信息,能够生成更加符合常识的图像。ARTIST基于Transformer架构,将文图生成任务分为图像矢量量化和文本引导的图像序列生成两个阶段。在第一阶段,模型使用VQGAN对图像进行矢量量化;在第二阶段,通过GPT模型并结合知识图谱中的实体知识来生成图像序列。在MUGE中文文图生成评测基准上,ARTIST表现出色,其生成效果优于其他模型。此外,EasyNLP框架提供了简单易用的接口,用户可以基于公开的Checkpoint进行少量领域相关的微调,实现各种艺术创作。
|
5天前
|
人工智能 NoSQL atlas
Fireworks AI和MongoDB:依托您的数据,借助优质模型,助力您开发高速AI应用
我们欣然宣布MongoDB与 Fireworks AI 正携手合作让客户能够利用生成式人工智能 (AI)更快速、更高效、更安全地开展创新活动
2544 1
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
大模型和传统ai的区别
在人工智能(AI)领域,大模型一直是一个热议的话题。从之前的谷歌 DeepMind、百度 Big. AI等,再到今天的百度GPT-3,人工智能技术经历了从“有”到“大”的转变。那么,大模型与传统 ai的区别在哪里?这对未来人工智能发展会产生什么影响?
|
5天前
|
人工智能 监控 安全
在园区引入AI大模型
5月更文挑战第5天
20 0
|
5天前
|
存储 机器学习/深度学习 人工智能
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
RAG:AI大模型联合向量数据库和 Llama-index,助力检索增强生成技术
|
5天前
|
机器学习/深度学习 人工智能 自然语言处理
对大模型和AI的认识与思考
2023年,笔者也参与了各种学习和实践,从大语言模型、多模态算法,文生图(Stable Diffusion)技术,到prompt工程实践和搭建文生图(Stable Diffusion)webui实操环境。在此对谈谈对大模型和AI的认识与思考,是为总结。5月更文挑战第3天
31 1
|
5天前
|
机器学习/深度学习 人工智能
超越Sora极限,120秒超长AI视频模型诞生!
【5月更文挑战第1天】 StreamingT2V技术突破AI视频生成界限,实现120秒超长连贯视频,超越Sora等传统模型。采用自回归方法,结合短期记忆的条件注意模块和长期记忆的外观保持模块,保证内容连贯性和动态性。在实际应用中,展示出优秀的动态性、连贯性和图像质量,但仍有优化空间,如处理复杂场景变化和连续性问题。[链接](https://arxiv.org/abs/2403.14773)
32 3
|
数据采集 存储 机器学习/深度学习
人类高质量AI训练方式:精细化数据集管理颠覆"唯SOTA论"
提起人工智能(AI),你可能会想起2006年杰弗里辛顿(Geoffrey Hinton)那篇奠定当代神经网络全新架构的论文“Learning of Multiple Layers of Representation”;也可能会想起为AI提供算力的亚马逊的AWS的云计算平台;又或者是斯坦福李飞飞教授的ImageNet项目。
233 0
人类高质量AI训练方式:精细化数据集管理颠覆"唯SOTA论"
|
机器学习/深度学习 人工智能 测试技术
中科院自动化所拿下星际争霸AI竞赛第四名,顺便发布了一个训练AI“大局观”的数据集
上周日,互动数字娱乐AI大会(AIIDE)2017中的星际争霸AI竞赛落下帷幕。这一竞赛是即时战略(RTS)游戏AI比赛中最重要的比赛之一,暴雪、DeepMind和Facebook人工智能研究院等机构也有赞助。
1295 0

热门文章

最新文章