端侧设备AI代理优化框架问世,领域内准确率可达97%

简介: 【7月更文挑战第30天】新框架Octo-planner提升端侧AI代理效率与准确性至97%。此框架由Nexa AI等机构合作研发,采用"Planner-Action"模式,将AI代理任务划分为规划与执行两部分,利用"Octopus"及"Phi-3 Mini"模型分别处理。通过fine-tuning技术及GPT-4辅助,实现在资源受限设备上的高性能。更多细节见论文: https://arxiv.org/pdf/2406.18082

最近,一篇名为"Octo-planner: On-device Language Model for Planner-Action Agents"的论文引起了广泛关注。这篇论文由来自Nexa AI、Stanford、MIT和IBM Watson AI Lab的研究人员共同撰写,提出了一种名为"Octo-planner"的新型AI代理优化框架。该框架旨在提高端侧设备(如智能手机)上AI代理的效率和准确性。

AI代理在各个领域都发挥着重要作用,从智能助理到自主机器人,它们能够根据用户的需求和环境的变化做出决策并执行相应的操作。然而,传统的AI代理通常需要在云端进行大量的计算和推理,这会导致高延迟和高能耗,限制了它们在资源受限的端侧设备上的应用。

为了解决这个问题,研究人员提出了一种名为"Planner-Action"的框架,该框架将AI代理的规划和执行过程分为两个独立的组件:规划代理(Planner)和执行代理(Action)。规划代理负责根据用户的查询生成一系列子任务,而执行代理则负责执行这些子任务。

在论文中,研究人员详细介绍了Octo-planner的实现细节。Octo-planner使用了一个名为"Octopus"的模型作为执行代理,该模型专门设计用于在端侧设备上执行函数调用。而规划代理则使用了一个名为"Phi-3 Mini"的模型,该模型经过了专门的训练,可以在资源受限的设备上高效地运行。

为了提高规划代理的准确性,研究人员采用了一种名为"fine-tuning"的技术,该技术通过在特定任务上对模型进行微调来提高其性能。在论文中,研究人员使用了一个名为"GPT-4"的大型语言模型来生成和验证规划数据,然后使用这些数据对Phi-3 Mini模型进行微调。

实验结果表明,Octo-planner在领域内的准确率可以达到97%,这表明该框架在提高端侧设备上AI代理的效率和准确性方面取得了显著的成果。此外,研究人员还提出了一种名为"multi-LoRA"的训练方法,该方法可以合并多个在特定功能子集上训练的LoRA模型的权重,从而提高模型在处理复杂多域查询时的灵活性和准确性。

然而,Octo-planner也存在一些限制和挑战。首先,虽然Octo-planner在特定领域的准确率很高,但在处理更复杂的任务或不熟悉的领域时,其性能可能会受到影响。其次,Octo-planner的规划代理需要在每次执行任务之前生成完整的计划,这可能无法适应需要实时决策或动态规划的场景。

此外,Octo-planner的实现也需要考虑资源受限设备上的计算和存储限制。虽然研究人员已经通过使用轻量级的模型和优化技术来减少这些限制的影响,但仍然需要进一步的研究来提高Octo-planner在实际应用中的可行性和鲁棒性。

Paper:https://arxiv.org/pdf/2406.18082

目录
相关文章
|
6天前
|
人工智能 Linux iOS开发
exo:22.1K Star!一个能让任何人利用日常设备构建AI集群的强大工具,组成一个虚拟GPU在多台设备上并行运行模型
exo 是一款由 exo labs 维护的开源项目,能够让你利用家中的日常设备(如 iPhone、iPad、Android、Mac 和 Linux)构建强大的 AI 集群,支持多种大模型和分布式推理。
219 100
|
11天前
|
人工智能 自然语言处理 搜索推荐
浙大通义联手推出慢思考长文本生成框架OmniThink,让AI写作突破知识边界
随着大模型(LLMs)的发展,AI 写作取得了较大进展。然而,现有的方法大多依赖检索知识增强生成(RAG)和角色扮演等技术,其在信息的深度挖掘方面仍存在不足,较难突破已有知识边界,导致生成的内容缺乏深度和原创性。
|
7天前
|
人工智能 开发框架 机器人
AstrBot:轻松将大模型接入QQ、微信等消息平台,打造多功能AI聊天机器人的开发框架,附详细教程
AstrBot 是一个开源的多平台聊天机器人及开发框架,支持多种大语言模型和消息平台,具备多轮对话、语音转文字等功能。
1966 13
AstrBot:轻松将大模型接入QQ、微信等消息平台,打造多功能AI聊天机器人的开发框架,附详细教程
|
9天前
|
机器学习/深度学习 存储 人工智能
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用
MNN-LLM App 是阿里巴巴基于 MNN-LLM 框架开发的 Android 应用,支持多模态交互、多种主流模型选择、离线运行及性能优化。
742 14
MNN-LLM App:在手机上离线运行大模型,阿里巴巴开源基于 MNN-LLM 框架开发的手机 AI 助手应用
|
6天前
|
人工智能 开发框架 数据可视化
Eino:字节跳动开源基于Golang的AI应用开发框架,组件化设计助力构建AI应用
Eino 是字节跳动开源的大模型应用开发框架,帮助开发者高效构建基于大模型的 AI 应用。支持组件化设计、流式处理和可视化开发工具。
118 27
|
1天前
|
人工智能 自然语言处理 架构师
Praison AI:LangChain危险了!这个低代码框架让AI智能体「自主协作」,1行代码搞定任务编排
Praison AI 是一个开源的多智能体框架,支持低代码创建和管理AI代理,提供多种流程类型和集成选项,适用于企业流程自动化、智能客服等场景。
53 18
|
9天前
|
存储 人工智能 弹性计算
NVIDIA NIM on ACK:优化生成式AI模型的部署与管理
本文结合NVIDIA NIM和阿里云容器服务,提出了基于ACK的完整服务化管理方案,用于优化生成式AI模型的部署和管理。
|
2天前
|
人工智能 编解码 vr&ar
Lumina-Video:上海 AI Lab 开源视频生成框架,动态程度可控,支持多分辨率
Lumina-Video 是由上海 AI Lab 和香港中文大学联合推出的高效视频生成框架,支持高质量视频生成、动态程度控制和多分辨率生成。
74 4
|
28天前
|
人工智能 算法 前端开发
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
OmAgent 是 Om AI 与浙江大学联合开源的多模态语言代理框架,支持多设备连接、高效模型集成,助力开发者快速构建复杂的多模态代理应用。
189 72
OmAgent:轻松构建在终端设备上运行的 AI 应用,赋能手机、穿戴设备、摄像头等多种设备
|
14天前
|
人工智能 自然语言处理 搜索推荐
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人
88 24
【上篇】-分两篇步骤介绍-如何用topview生成和自定义数字人-关于AI的使用和应用-如何生成数字人-优雅草卓伊凡-如何生成AI数字人

热门文章

最新文章