ICML 2024:Transformer究竟如何推理?基于样例还是基于规则

简介: 【7月更文挑战第12天】ICML 2024研究表明Transformer模型在解决数学问题时倾向于基于样例而非规则的推理。通过规则遵循微调(RFFT),模型被教会遵循规则,实现从1-5位到12位加法的高精度泛化,提升40%以上。论文探讨了提升AI在数学推理上的潜力。[arxiv.org/abs/2402.17709](https://arxiv.org/abs/2402.17709)**

在人工智能领域,Transformer模型因其在各种复杂任务中的出色表现而备受关注。然而,尽管它们在许多方面取得了成功,但这些模型在处理一些对人类来说简单直观的数学问题时仍然存在困难,例如加法。

对于人类来说,学习基本的加法规则并应用于任何长度的新问题是相对容易的。然而,Transformer模型在执行相同操作时却遇到了困难。相反,它们可能会依赖在训练语料库中看到的类似情况来解决问题。

为了探索Transformer模型在数学问题上的推理机制,研究人员提出了两种不同的推理机制:“基于规则的推理”和“基于样例的推理”。基于规则的推理对于获得系统泛化能力至关重要,因此研究人员旨在确定Transformer模型在数学问题上使用的是哪种推理机制。

通过在五个数学任务上进行精心设计的干预实验,研究人员证实了Transformer模型在使用基于样例的推理,无论是否使用了草稿纸。这与之前的观察结果一致,即Transformer模型使用子图匹配/快捷学习来进行推理。

为了减轻这个问题,研究人员提出了一种称为规则遵循微调(Rule-Following Fine-Tuning,RFFT)的技术,以教授Transformer模型进行基于规则的推理。具体而言,他们向输入中提供明确的规则,然后指导Transformer模型逐步背诵和遵循这些规则。

通过RFFT,研究人员成功地使在1-5位加法上微调的大型语言模型(LLMs)能够泛化到最多12位加法,准确率超过95%。这比使用草稿纸的方法提高了40%以上。这一显著的改进表明,明确教授LLMs使用规则可以帮助它们学习基于规则的推理,并在长度上更好地泛化。

该研究还讨论了Transformer模型在其他数学任务上的表现,并提出了未来的研究方向,以进一步提高这些模型在数学问题上的推理能力。

论文地址:https://arxiv.org/abs/2402.17709

目录
相关文章
|
机器学习/深度学习 关系型数据库 MySQL
大模型中常用的注意力机制GQA详解以及Pytorch代码实现
GQA是一种结合MQA和MHA优点的注意力机制,旨在保持MQA的速度并提供MHA的精度。它将查询头分成组,每组共享键和值。通过Pytorch和einops库,可以简洁实现这一概念。GQA在保持高效性的同时接近MHA的性能,是高负载系统优化的有力工具。相关论文和非官方Pytorch实现可进一步探究。
1692 4
|
机器学习/深度学习 自然语言处理 PyTorch
【PyTorch实战演练】基于AlexNet的预训练模型介绍
【PyTorch实战演练】基于AlexNet的预训练模型介绍
654 0
|
2月前
|
搜索推荐 算法 大数据
基于python大数据的旅游景点可视化与推荐系统
本系统基于大数据与网络技术,构建个性化旅游推荐平台。通过收集用户偏好及行为数据,结合机器学习算法,提供精准的旅游目的地、住宿及交通推荐,旨在优化旅游信息传递,提升用户决策效率与旅行体验。
|
人工智能 算法
青否数字人7.0正式发布,数字人克隆+声音克隆效果大幅提升!
青否直播+短视频数字人7.0今日正式发布,开发团队耗时3个月,重点对数字人克隆+声音克隆效果,以及克隆方式进行了全面优化。
青否数字人7.0正式发布,数字人克隆+声音克隆效果大幅提升!
|
存储 机器学习/深度学习 数据安全/隐私保护
最全Pillow(PIL)入门教程(非常详细)_python pillow 教程,2024年最新Python面试送分题
最全Pillow(PIL)入门教程(非常详细)_python pillow 教程,2024年最新Python面试送分题
最全Pillow(PIL)入门教程(非常详细)_python pillow 教程,2024年最新Python面试送分题
|
机器学习/深度学习 计算机视觉 PyTorch
PyTorch 2.2 中文官方教程(四)(3)
PyTorch 2.2 中文官方教程(四)
375 0
PyTorch 2.2 中文官方教程(四)(3)
|
机器学习/深度学习 自然语言处理 计算机视觉
【论文泛读】ConvNeXt:A ConvNet for the 2020s(新时代的卷积)
【论文泛读】ConvNeXt:A ConvNet for the 2020s(新时代的卷积)
|
数据处理 计算机视觉 Python
图像数据处理:基本技巧与实例分析
图像数据处理:基本技巧与实例分析
464 0
|
机器学习/深度学习 编解码 缓存
【Pytorch】利用PyTorch实现图像识别
【Pytorch】利用PyTorch实现图像识别
1012 1
|
Web App开发 前端开发 安全
使用JS+socket.io+WebRTC+nodejs+express搭建一个简易版远程视频聊天
使用JS+socket.io+WebRTC+nodejs+express搭建一个简易版远程视频聊天
864 0
使用JS+socket.io+WebRTC+nodejs+express搭建一个简易版远程视频聊天