next-token被淘汰!Meta实测多token训练方法,推理提速3倍,性能大涨10%+

简介: 【6月更文挑战第11天】Meta AI的最新研究表明,多token训练方法能提升大型语言模型的性能和推理速度。与传统next-token预测相比,该方法让模型预测多个未来token,增强上下文理解和生成能力。实验显示,这种方法在代码生成、摘要生成和数学问题解答等任务上性能提升10%+,推理速度提升至原来的3倍,为模型部署提供了更优选择。论文链接:https://arxiv.org/pdf/2404.19737

Meta AI 的最新研究提出了一种多 token 训练方法,有望改变大型语言模型的训练方式。这项研究的论文题为《Better & Faster Large Language Models via Multi-token Prediction》,发表在 arXiv 上,并引起了广泛的关注。

在自然语言处理领域,大型语言模型(如 GPT 和 Llama)的训练通常基于 next-token 预测损失。这意味着模型在训练过程中会学习预测下一个 token(可以是单词或字符)的概率分布。然而,这种方式在处理多 token 序列时可能存在一些局限性。

为了解决这些局限性,Meta 的研究团队提出了一种多 token 训练方法。与传统的 next-token 预测不同,这种新方法要求模型在每个位置预测多个未来的 token。具体来说,在训练过程中,模型需要使用 n 个独立的输出头,在共享的模型主干上同时预测接下来的 n 个 token。

这种多 token 预测方法可以被视为一种辅助训练任务。通过在训练过程中同时预测多个未来的 token,模型可以学习到更长远的上下文信息,从而提高其生成和理解文本的能力。

为了验证这种多 token 训练方法的有效性,Meta 的研究团队进行了一系列的实验。他们发现,使用多 token 预测方法训练的大型语言模型在多个下游任务上都表现出了显著的性能提升。

在代码生成任务上,使用多 token 预测方法训练的模型在 HumanEval 和 MBPP 等基准测试上的性能分别提高了 12% 和 17%。此外,使用多 token 预测方法训练的模型在处理更长的字节序列时也表现出了更好的性能,这对于处理源代码等具有复杂语法结构的任务尤其重要。

在自然语言处理任务上,使用多 token 预测方法训练的模型在摘要生成和数学问题解答等任务上也表现出了更好的性能。特别是在摘要生成任务上,使用多 token 预测方法训练的模型在 ROUGE-L F1 分数上比使用 next-token 预测方法训练的模型提高了 2% 到 4%。

除了性能提升外,Meta 的研究团队还发现,使用多 token 预测方法训练的模型在推理速度上也得到了显著的提升。他们发现,使用 4-token 预测方法训练的模型在推理速度上可以提高 3 倍,即使对于较大的批处理规模也是如此。

这对于实际应用场景中的模型部署具有重要意义。在许多应用中,模型的推理速度是决定其可用性的关键因素之一。通过使用多 token 预测方法,可以显著提高模型的推理速度,从而提高其在实际应用中的可用性。

论文链接:https://arxiv.org/pdf/2404.19737

目录
相关文章
|
人工智能 监控 算法
【AI 现况分析】AI 应用导致的隐私问题分析
【1月更文挑战第27天】【AI 现况分析】AI 应用导致的隐私问题分析
|
存储 测试技术 开发工具
软考中的UML图、数据流图等二十余种示例
软考中的UML图、数据流图等二十余种示例
1785 0
|
自然语言处理 测试技术 人工智能
Meta等最新研究:多token预测,提升大模型推理效率
【6月更文挑战第2天】Meta等机构的研究人员提出了一种新的大型语言模型训练方法——多token预测,以提高样本效率和推理速度。该方法要求模型同时预测多个接下来的token,而非传统的单一token预测,从而减少局部模式依赖,提高模型的宏观决策能力。实验表明,这种方法在提升模型性能和推理速度方面效果显著,尤其在编程任务中表现出色。然而,多token预测可能需要更多计算资源,并不适用于所有NLP任务,其在自然语言处理领域的应用仍有待深入研究。论文链接:https://arxiv.org/abs/2404.19737
484 7
|
6月前
|
人工智能 缓存 监控
AI 网关需要具备的 10 大基本能力
我们认为 AI 网关并不是独立于 API 网关的新形态,本质也是一种 API 网关,区别在于针对 AI 场景的新需求专门做了扩展,它既是 API 网关的继承,也是 API 网关的演进。因此我们从 API 视角,对 AI 网关的能力做了分类,便于形成概念的共识。
256 12
|
9月前
|
PHP
全新uniapp小说漫画APP小说源码/会员阅读/月票功能
价值980的uniapp小说漫画APP小说源码/会员阅读/月票功能
373 20
|
SQL XML JavaScript
【若依Java】15分钟玩转若依二次开发,新手小白半小时实现前后端分离项目,springboot+vue3+Element Plus+vite实现Java项目和管理后台网站功能
摘要: 本文档详细介绍了如何使用若依框架快速搭建一个基于SpringBoot和Vue3的前后端分离的Java管理后台。教程涵盖了技术点、准备工作、启动项目、自动生成代码、数据库配置、菜单管理、代码下载和导入、自定义主题样式、代码生成、启动Vue3项目、修改代码、以及对代码进行自定义和扩展,例如单表和主子表的代码生成、树形表的实现、商品列表和分类列表的改造等。整个过程详细地指导了如何从下载项目到配置数据库,再到生成Java和Vue3代码,最后实现前后端的运行和功能定制。此外,还提供了关于软件安装、环境变量配置和代码自动生成的注意事项。
21286 67
|
JavaScript
Vue3滑动输入条(Slider)
这是一个可高度定制的滑动输入条组件,支持多种配置选项,如宽度、最小值、最大值、是否禁用、双滑块模式等。主要功能包括点击滑动条快速定位并获取数值、拖动滑块调整数值、键盘操作调整数值以及自定义Tooltip显示格式。组件通过监听DOM尺寸变化来动态调整布局,并利用requestAnimationFrame优化动画效果,提供了丰富的交互体验。在线预览和详细代码示例可见[这里](https://themusecatcher.github.io/vue-amazing-ui/guide/components/slider.html)。
339 4
Vue3滑动输入条(Slider)
|
10月前
|
Kubernetes Cloud Native 前端开发
Kubernetes入门指南:从基础到实践
Kubernetes入门指南:从基础到实践
255 0
|
人工智能 物联网 API
LLM 大模型学习必知必会系列(十三):基于SWIFT的VLLM推理加速与部署实战
LLM 大模型学习必知必会系列(十三):基于SWIFT的VLLM推理加速与部署实战
LLM 大模型学习必知必会系列(十三):基于SWIFT的VLLM推理加速与部署实战
|
机器学习/深度学习 算法 数据挖掘
【数据挖掘】PCA 主成分分析算法过程及原理讲解
主成分分析(PCA)的原理和算法过程。
831 0