微软靠“想象力”解决大语言模型调用工具两大难题!方法已开源

简介: 【2月更文挑战第24天】微软靠“想象力”解决大语言模型调用工具两大难题!方法已开源

74967d99dfc24b4b8981ef42406a87ce.jpeg
在人工智能领域,大型语言模型(LLMs)的能力和应用范围不断扩大,但如何让这些模型更准确地使用外部工具,以获取最新信息并执行实际行动,一直是一个挑战。微软的研究团队提出了一种名为模拟试错法(Simulated Trial and Error, STE)的创新方法,旨在解决这一难题。该方法受到生物学中工具使用行为的启发,通过模拟试错、想象和记忆这三个关键机制,显著提升了LLMs在工具使用方面的准确性。

STE方法的核心在于利用LLMs的“想象力”来模拟使用工具的场景,并通过与工具的交互学习执行反馈。这一过程涉及到短期记忆和长期记忆的运用,以提高探索的深度和广度。短期记忆帮助模型从最近的试验中学习,而长期记忆则记录过去的探索经验,支持模型在长时间范围内的渐进式学习。

在实验中,STE方法在上下文学习和微调设置下都显示出显著的效果。例如,它将Mistral-Instruct-7B模型的工具使用能力提高了46.7%,使其性能超越了GPT-4。此外,研究团队还展示了通过经验重放策略实现工具的有效持续学习,这有助于模型在保留先前技能的同时学习新工具。

STE方法的提出,不仅提高了LLMs的工具使用准确性,也为LLMs的持续学习和适应性提供了新的思路。这种方法的开源,也为整个人工智能研究社区提供了宝贵的资源,有助于推动相关技术的发展。

然而,STE方法也存在一些局限性。例如,它依赖于强大的模型进行探索和利用,这可能会随着模型能力的提升而逐渐减弱。此外,组合工具使用和规划的能力也是未来研究需要关注的领域。基于示例的微调方法虽然有效,但在教授模型何时不使用特定工具方面存在困难。这些挑战为未来的研究提供了方向,包括如何扩展记忆容量以适应更长的上下文限制,以及如何设计更有效的工具“遗忘”机制。

微软的STE方法为LLMs的工具学习提供了一种新的视角,其在提高模型准确性和适应性方面的潜力值得进一步探索。随着人工智能技术的不断进步,我们期待看到更多类似的创新方法出现,以解决LLMs在实际应用中遇到的挑战。

目录
相关文章
|
2月前
|
人工智能 知识图谱 Docker
KAG:增强 LLM 的专业能力!蚂蚁集团推出专业领域知识增强框架,支持逻辑推理和多跳问答
KAG 是蚂蚁集团推出的专业领域知识服务框架,通过知识增强提升大型语言模型在特定领域的问答性能,支持逻辑推理和多跳事实问答,显著提升推理和问答的准确性和效率。
695 46
KAG:增强 LLM 的专业能力!蚂蚁集团推出专业领域知识增强框架,支持逻辑推理和多跳问答
|
2月前
|
人工智能 自然语言处理 搜索推荐
《深度剖析:开源与闭源模型,AI舞台上的不同角色》
在人工智能领域,开源与闭源模型各有优劣。闭源模型由大公司精心打造,初始性能优越,但优化受限;开源模型则依靠社区力量,灵活性高、迭代迅速,长期潜力大。在学术研究中,开源模型透明性高,利于创新;商业应用上,闭源模型稳定性强,适合高要求场景。资源受限环境中,开源模型更易裁剪优化。企业和开发者应根据需求选择合适模型,两者共同推动AI发展。
400 9
|
10月前
|
人工智能 安全 算法
【平衡点:解锁中国大模型开源闭源的新时代】关于大模型是否开源的分析
本文探讨了开源与闭源软件在大模型技术发展中的角色,深入比较了两者在质量、安全、产业化、适应性和可靠性等方面的优缺点。开源软件得益于全球开发者社区,通常在创新和适应性上表现出色,但安全性和质量可能因分散的开发而有所波动。闭源软件则在代码质量和安全性上有一定优势,但可能限制了产业的协作与创新。 在商业模式方面,开源通常依赖服务和支持盈利,闭源则通过软件授权和订阅服务获利。开源模式的市场竞争更激烈,闭源模式则更注重市场份额和控制。企业需要根据自身情况选择合适的战略,有些可能会采用
343 1
|
10月前
|
机器学习/深度学习 人工智能 算法
开源vs闭源大模型如何塑造技术的未来?开源模型的优劣势&未来发展方向
开源vs闭源大模型如何塑造技术的未来?开源模型的优劣势&未来发展方向
1531 0
|
人工智能 弹性计算 算法
我终于发现了一件还没有被 AI 取代的事情
AIGC 是当下最火的概念之一。AIGC 被认为是继专业生成内容(Professional Generated Content, PGC)和用户生成内容(User Generated Content, UGC)之后,利用人工智能技术自动生成内容的新型生产方式。AI 生成内容的形式相当丰富,除了文字外,还可以进行绘画、作曲、演唱、编剧、设计等。最近热度非常高的 Text to Image 就是 AI 加持下非常时髦的一种图片创造方式。本文向大家介绍如何基于 Stable Diffusion 实现文字到图片的生成。
454 0
我终于发现了一件还没有被 AI 取代的事情
|
机器学习/深度学习 人工智能 算法
AI开发大一统:谷歌OpenXLA开源,整合所有框架和AI芯片
AI开发大一统:谷歌OpenXLA开源,整合所有框架和AI芯片
206 0
|
人工智能 算法 机器人
如何解锁大模型时代AI研究开发新范式 ?尽在2023WAIC AI开发者领袖论坛
如何解锁大模型时代AI研究开发新范式 ?尽在2023WAIC AI开发者领袖论坛
155 0
|
自然语言处理 JavaScript 前端开发
解放程序员,创造更大价值——Cursor集成GPT-4人工智能技术的开发环境
解放程序员,创造更大价值——Cursor集成GPT-4人工智能技术的开发环境
254 0
|
机器学习/深度学习 人工智能 监控
OpenAI发布通用人工智能路线图:AGI比想象中来得更快
OpenAI发布通用人工智能路线图:AGI比想象中来得更快
297 0
|
机器学习/深度学习 自然语言处理 达摩院
机器人视觉认知能力将取代人类?ModelScope开源mPLUG模型带你一键体验大火的视觉问答能力
ModelScope上开源了达摩院众多业界最强多模态模型,其中就有首超人类的多模态视觉问答模型mPLUG,小编带大家一起体验下多模态预训练模型的能力。