端侧设备AI代理优化框架问世,领域内准确率可达97%

简介: 【7月更文挑战第30天】新框架Octo-planner提升端侧AI代理效率与准确性至97%。此框架由Nexa AI等机构合作研发,采用"Planner-Action"模式,将AI代理任务划分为规划与执行两部分,利用"Octopus"及"Phi-3 Mini"模型分别处理。通过fine-tuning技术及GPT-4辅助,实现在资源受限设备上的高性能。更多细节见论文: https://arxiv.org/pdf/2406.18082

最近,一篇名为"Octo-planner: On-device Language Model for Planner-Action Agents"的论文引起了广泛关注。这篇论文由来自Nexa AI、Stanford、MIT和IBM Watson AI Lab的研究人员共同撰写,提出了一种名为"Octo-planner"的新型AI代理优化框架。该框架旨在提高端侧设备(如智能手机)上AI代理的效率和准确性。

AI代理在各个领域都发挥着重要作用,从智能助理到自主机器人,它们能够根据用户的需求和环境的变化做出决策并执行相应的操作。然而,传统的AI代理通常需要在云端进行大量的计算和推理,这会导致高延迟和高能耗,限制了它们在资源受限的端侧设备上的应用。

为了解决这个问题,研究人员提出了一种名为"Planner-Action"的框架,该框架将AI代理的规划和执行过程分为两个独立的组件:规划代理(Planner)和执行代理(Action)。规划代理负责根据用户的查询生成一系列子任务,而执行代理则负责执行这些子任务。

在论文中,研究人员详细介绍了Octo-planner的实现细节。Octo-planner使用了一个名为"Octopus"的模型作为执行代理,该模型专门设计用于在端侧设备上执行函数调用。而规划代理则使用了一个名为"Phi-3 Mini"的模型,该模型经过了专门的训练,可以在资源受限的设备上高效地运行。

为了提高规划代理的准确性,研究人员采用了一种名为"fine-tuning"的技术,该技术通过在特定任务上对模型进行微调来提高其性能。在论文中,研究人员使用了一个名为"GPT-4"的大型语言模型来生成和验证规划数据,然后使用这些数据对Phi-3 Mini模型进行微调。

实验结果表明,Octo-planner在领域内的准确率可以达到97%,这表明该框架在提高端侧设备上AI代理的效率和准确性方面取得了显著的成果。此外,研究人员还提出了一种名为"multi-LoRA"的训练方法,该方法可以合并多个在特定功能子集上训练的LoRA模型的权重,从而提高模型在处理复杂多域查询时的灵活性和准确性。

然而,Octo-planner也存在一些限制和挑战。首先,虽然Octo-planner在特定领域的准确率很高,但在处理更复杂的任务或不熟悉的领域时,其性能可能会受到影响。其次,Octo-planner的规划代理需要在每次执行任务之前生成完整的计划,这可能无法适应需要实时决策或动态规划的场景。

此外,Octo-planner的实现也需要考虑资源受限设备上的计算和存储限制。虽然研究人员已经通过使用轻量级的模型和优化技术来减少这些限制的影响,但仍然需要进一步的研究来提高Octo-planner在实际应用中的可行性和鲁棒性。

Paper:https://arxiv.org/pdf/2406.18082

相关文章
健康监测设备的技术革命:AI+物联网如何让你随时掌握健康数据?
健康监测设备的技术革命:AI+物联网如何让你随时掌握健康数据?
149 19
36.7K star!拖拽构建AI流程,这个开源LLM应用框架绝了!
`Flowise` 是一款革命性的低代码LLM应用构建工具,开发者通过可视化拖拽界面,就能快速搭建基于大语言模型的智能工作流。该项目在GitHub上线不到1年就斩获**36.7K星标**,被开发者誉为"AI时代的乐高积木"。
这个AI能把PSD变视频!人物/场景/道具任意组合!SkyReels-A2:昆仑万维推出的可控多元素视频生成框架
SkyReels-A2是昆仑万维推出的创新视频生成框架,通过扩散模型和图像-文本联合嵌入技术,实现多元素精准组合与高质量视频输出。
64 25
漫画师福音!开源AI神器让线稿着色快如闪电!MagicColor:港科大开源多实例线稿着色框架,一键生成动画级彩图
MagicColor是香港科技大学推出的多实例线稿着色框架,基于扩散模型和自监督训练策略,实现单次前向传播完成多实例精准着色,大幅提升动画制作和数字艺术创作效率。
54 20
漫画师福音!开源AI神器让线稿着色快如闪电!MagicColor:港科大开源多实例线稿着色框架,一键生成动画级彩图
OPPO联合港科大推出多模态推理优化框架 OThink-MR1:让AI学会『举一反三』,几何推理准确率暴增
OThink-MR1是OPPO与港科大联合研发的多模态优化框架,通过动态KL散度策略和奖励模型显著提升模型在视觉计数等复杂任务中的泛化能力。
58 20
OPPO联合港科大推出多模态推理优化框架 OThink-MR1:让AI学会『举一反三』,几何推理准确率暴增
AI做奥赛题能及格吗?OlympicArena:上海交大推出多学科认知推理基准测试框架,挑战AI极限
OlympicArena是由上海交大等机构联合推出的多学科认知推理基准测试框架,包含7大学科11,163道奥林匹克竞赛级题目,通过细粒度评估推动AI向超级智能发展。
52 12
AI做奥赛题能及格吗?OlympicArena:上海交大推出多学科认知推理基准测试框架,挑战AI极限
OpenDeepSearch:搜索引擎革命!这个开源深度搜索工具让AI代理直接读懂网页,复杂问题一键拆解
OpenDeepSearch是基于开源推理模型的深度搜索工具,通过语义重排和多源整合优化检索效果,支持与AI代理无缝集成,提供快速和专业两种搜索模式。
124 10
OpenDeepSearch:搜索引擎革命!这个开源深度搜索工具让AI代理直接读懂网页,复杂问题一键拆解
DeepMesh:3D建模革命!清华团队让AI自动优化拓扑,1秒生成工业级网格
DeepMesh 是由清华大学和南洋理工大学联合开发的 3D 网格生成框架,基于强化学习和自回归变换器,能够生成高质量的 3D 网格,适用于虚拟环境构建、动态内容生成、角色动画等多种场景。
119 4
DeepMesh:3D建模革命!清华团队让AI自动优化拓扑,1秒生成工业级网格
Resume Matcher:增加面试机会!开源AI简历优化工具,一键解析简历和职位描述并优化
Resume Matcher 是一款开源AI简历优化工具,通过解析简历和职位描述,提取关键词并计算文本相似性,帮助求职者优化简历内容,提升通过自动化筛选系统(ATS)的概率,增加面试机会。
130 18
Resume Matcher:增加面试机会!开源AI简历优化工具,一键解析简历和职位描述并优化
AI框架的赢者法则:生态繁荣的昇思MindSpore,成为大模型时代的新选择
2024年被视为大模型应用的元年。昇思MindSpore AI框架凭借其强大的开源社区和技术创新,在全球范围内迅速崛起。截至2024年11月,该框架的下载量已超过1100万次,覆盖130多个国家和地区的2400多个城市,拥有3.7万名贡献者。昇思MindSpore不仅在人才培养和社区治理方面表现出色,还在大模型的开发、训练和应用中发挥了关键作用,支持了50多个主流大模型,覆盖15个行业。随着其市场份额预计达到30%,昇思MindSpore正逐步成为行业共识,推动大模型在各领域的广泛应用。
102 12

热门文章

最新文章