Mahilo:多智能体实时协作框架开源!人类与AI无缝交互,复杂任务一键协同

本文涉及的产品
NLP 自学习平台,3个模型定制额度 1个月
NLP自然语言处理_基础版,每接口每天50万次
NLP自然语言处理_高级版,每接口累计50万次
简介: Mahilo 是一个灵活的多智能体框架,支持创建与人类互动的多智能体系统,适用于从客户服务到紧急响应等多种场景。

❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦


🎧 “AI多智能体框架Mahilo:让智能体与人类无缝协作,提升决策效率!”

大家好,我是蚝油菜花。你是否也遇到过——

  • 👉 复杂的多智能体系统难以协调,导致效率低下
  • 👉 智能体之间的上下文共享不足,协作效果差
  • 👉 人类在智能体决策中的参与度低,难以实时干预

今天揭秘的 Mahilo,是一个灵活的多智能体框架,支持创建与人类互动的多智能体系统。它通过实时通信、上下文共享和人类监督,提升智能体与人类的协作效率。无论是客户服务、紧急响应,还是团队协作,Mahilo 都能为你提供强大的支持。接下来,我们将深入探讨 Mahilo 的核心功能和技术原理。

🚀 快速阅读

Mahilo 是一个支持多智能体与人类互动的框架。

  1. 核心功能:支持实时通信、上下文共享、人类监督和灵活的通信模式。
  2. 技术原理:基于 WebSocket 实现实时通信,智能体管理器负责协调智能体之间的交互。

Mahilo 是什么

mahilo

Mahilo 是一个灵活的多智能体框架,支持创建与人类互动的多智能体系统。它通过实时语音和文本通信,使智能体之间能够自主共享上下文和信息,同时保持人类对交互的监督和控制。

Mahilo 提供强大的组织级策略管理功能,确保所有智能体的行为和安全性一致。它支持复杂的多智能体架构,适用于从客户服务到紧急响应等多种应用场景。基于简单易用的开发接口和实时通信能力,Mahilo 能够高效地协调多个智能体与人类用户的交互,提升协作效率和决策能力。

Mahilo 的主要功能

  • 多智能体集成:支持从不同框架(如 LangGraph、Pydantic AI 等)集成智能体。
  • 实时通信:提供文本和语音聊天功能,支持多用户同时与智能体交互。
  • 共享上下文:智能体之间可以自动共享上下文信息,增强协作能力。
  • 人类监督:支持人类实时参与,提供决策支持或纠正智能体行为。
  • 灵活的通信模式:支持点对点和层级化通信模式,适应不同场景。
  • 会话管理:支持持久化对话,确保会话连续性。
  • 消息追踪与监控:支持消息生命周期追踪、消息签名和重试机制。
  • 语音交互:支持 OpenAI 的 Realtime API,提供流畅的语音交互。

Mahilo 的技术原理

  • 智能体管理器(AgentManager):作为智能体的“团队”,负责管理智能体之间的通信和上下文共享。
  • 实时通信:基于 WebSocket 提供实时通信支持,确保智能体与用户之间的即时互动。
  • 消息协议和消息智能体:引入标准化的消息协议,支持消息签名、追踪和持久化存储。
  • 人类集成:基于 WebSocket 实时聊天接口,人类专家在需要时能介入智能体的决策过程。
  • 灵活的通信模式:支持点对点和层级化通信模式,适应从复杂协作到集中式控制的不同场景。
  • 上下文共享与智能信息检索:智能体能访问其他智能体的对话历史,基于 chat_with_agent 函数请求特定信息。
  • 扩展性:提供 BaseAgent 类,方便开发者创建自定义智能体,支持多种框架的集成。

如何运行 Mahilo

1. 安装

pip install mahilo

如果需要使用语音功能,安装时需添加 voice 扩展:

pip install mahilo[voice]

2. 使用示例

from mahilo import BaseAgent, AgentManager, ServerManager
from mahilo.integrations.langgraph.agent import LangGraphAgent

# 创建一个 Mahilo 智能体
sales_agent = BaseAgent(
    type="sales_agent",
    description=sales_agent_prompt,
    tools=sales_tools,
)

# 创建一个 LangGraph 智能体
marketing_agent = LangGraphAgent(
    langgraph_agent=graph_builder,
    name="MarketingAgent",
    description=marketing_agent_prompt,
    can_contact=[],
)

# 创建智能体管理器
manager = AgentManager()
manager.register_agent(sales_agent)
manager.register_agent(marketing_agent)

# 激活智能体
marketing_agent.activate(server_id="1")

# 初始化服务器管理器
server = ServerManager(manager)
# 启动 WebSocket 服务器
server.run()

3. 连接智能体

mahilo connect --url http://localhost:8000 --agent-name marketing_agent

如果需要使用语音功能,添加 --voice 参数:

mahilo connect --agent-name marketing_agent --voice

资源


❤️ 如果你也关注 AI 的发展现状,且对 AI 应用开发感兴趣,我会每日分享大模型与 AI 领域的开源项目和应用,提供运行实例和实用教程,帮助你快速上手AI技术!

🥦 AI 在线答疑 -> 智能检索历史文章和开源项目 -> 尽在微信公众号 -> 搜一搜:蚝油菜花 🥦

相关文章
|
3天前
|
机器学习/深度学习 人工智能 编解码
AI视频生成也能自动补全!Wan2.1 FLF2V:阿里通义开源14B视频生成模型,用首尾两帧生成过渡动画
万相首尾帧模型是阿里通义开源的14B参数规模视频生成模型,基于DiT架构和高效视频压缩VAE,能够根据首尾帧图像自动生成5秒720p高清视频,支持多种风格变换和细节复刻。
105 7
AI视频生成也能自动补全!Wan2.1 FLF2V:阿里通义开源14B视频生成模型,用首尾两帧生成过渡动画
|
5天前
|
人工智能 算法 API
多模态模型卷王诞生!InternVL3:上海AI Lab开源78B多模态大模型,支持图文视频全解析!
上海人工智能实验室开源的InternVL3系列多模态大语言模型,通过原生多模态预训练方法实现文本、图像、视频的统一处理,支持从1B到78B共7种参数规模。
104 6
多模态模型卷王诞生!InternVL3:上海AI Lab开源78B多模态大模型,支持图文视频全解析!
|
3天前
|
人工智能 自然语言处理 物联网
用AI体验瞬息全宇宙!InstantCharacter:腾讯混元开源角色定制图像生成神器,一键打造你的专属角色
InstantCharacter是腾讯混元团队基于扩散Transformer架构开发的开源图像生成工具,通过可扩展适配器和大规模角色数据集实现高保真、角色一致性的图像生成,支持单图输入和文本控制。
75 3
用AI体验瞬息全宇宙!InstantCharacter:腾讯混元开源角色定制图像生成神器,一键打造你的专属角色
|
3天前
|
人工智能 自然语言处理 监控
基于DeepSeek R1改进的AI安全模型!MAI-DS-R1:微软开源AI安全卫士,敏感话题响应率高达99.3%
微软开源的MAI-DS-R1是基于DeepSeek R1改进的AI模型,通过后训练优化将敏感话题响应率提升至99.3%,同时将有害内容风险降低50%,保持原版推理能力并增强多语言支持。
80 3
基于DeepSeek R1改进的AI安全模型!MAI-DS-R1:微软开源AI安全卫士,敏感话题响应率高达99.3%
|
7天前
|
人工智能 开发框架 安全
Serverless MCP 运行时业界首发,函数计算让 AI 应用最后一公里提速
作为云上托管 MCP 服务的最佳运行时,函数计算 FC 为阿里云百炼 MCP 提供弹性调用能力,用户只需提交 npx 命令即可“零改造”将开源 MCP Server 部署到云上,函数计算 FC 会准备好计算资源,并以弹性、可靠的方式运行 MCP 服务,按实际调用时长和次数计费,欢迎你在阿里云百炼和函数计算 FC 上体验 MCP 服务。
117 29
|
24天前
|
人工智能 数据可视化 API
36.7K star!拖拽构建AI流程,这个开源LLM应用框架绝了!
`Flowise` 是一款革命性的低代码LLM应用构建工具,开发者通过可视化拖拽界面,就能快速搭建基于大语言模型的智能工作流。该项目在GitHub上线不到1年就斩获**36.7K星标**,被开发者誉为"AI时代的乐高积木"。
128 8
|
26天前
|
机器学习/深度学习 存储 人工智能
AI职场突围战:夸克应用+生成式人工智能认证,驱动“打工人”核心竞争力!
在AI浪潮推动下,生成式人工智能(GAI)成为职场必备工具。文中对比了夸克、豆包、DeepSeek和元宝四大AI应用,夸克以“超级入口”定位脱颖而出。同时,GAI认证为职场人士提供系统学习平台,与夸克结合助力职业发展。文章还探讨了职场人士如何通过加强学习、关注技术趋势及培养合规意识,在AI时代把握机遇。
|
21天前
|
人工智能 API 计算机视觉
AI-ClothingTryOn:服装店老板连夜下架试衣间!基于Gemini开发的AI试衣应用,一键生成10种穿搭效果
AI-ClothingTryOn是基于Google Gemini技术的虚拟试衣应用,支持人物与服装照片智能合成,可生成多达10种试穿效果版本,并提供自定义提示词优化功能。
153 17
AI-ClothingTryOn:服装店老板连夜下架试衣间!基于Gemini开发的AI试衣应用,一键生成10种穿搭效果
|
14天前
|
存储 人工智能 监控
一键部署 Dify + MCP Server,高效开发 AI 智能体应用
本文将着重介绍如何通过 SAE 快速搭建 Dify AI 研发平台,依托 Serverless 架构提供全托管、免运维的解决方案,高效开发 AI 智能体应用。
1959 29
|
25天前
|
机器学习/深度学习 人工智能 自然语言处理
多模态AI核心技术:CLIP与SigLIP技术原理与应用进展
近年来,多模态表示学习在人工智能领域取得显著进展,CLIP和SigLIP成为里程碑式模型。CLIP由OpenAI提出,通过对比学习对齐图像与文本嵌入空间,具备强大零样本学习能力;SigLIP由Google开发,采用sigmoid损失函数优化训练效率与可扩展性。两者推动了多模态大型语言模型(MLLMs)的发展,如LLaVA、BLIP-2和Flamingo等,实现了视觉问答、图像描述生成等复杂任务。这些模型不仅拓展了理论边界,还为医疗、教育等领域释放技术潜力,标志着多模态智能系统的重要进步。
136 13
多模态AI核心技术:CLIP与SigLIP技术原理与应用进展

热门文章

最新文章