解锁 Qwen3 的Agent能力,CookBook来咯!

简介: Qwen3系列模型具备强大Agent能力,但从模型到Agent仍存技术难题。为此,我们推出基于Qwen-Agent框架的3个CookBook示例,展示如何让Qwen3丝滑调用MCP Server全过程。不论是本地部署还是API调用模型,开发者均可通过Qwen-Agent完成复杂任务。CookBook包括自然语言驱动数据库操作、云端高德API地理服务及文档转思维导图等功能。Qwen-Agent封装了工具调用模板和解析器,原生支持MCP协议,大幅降低开发成本。欢迎体验并反馈。

Qwen3系列模型拥有卓越的Agent能力。然而,从模型到Agent,开发者们仍存在许多技术及工程适配等难题。

今天,我们推出3个基于Qwen-Agent框架的CookBook,演示如何通过这一框架让Qwen3丝滑调用MCP Server的全过程。不论是本地部署模型或是API调用模型,开发者均可通过Qwen-Agent来完成一个复杂的Agent任务,甚至轻松打造令人惊艳的Agent应用。

Qwen-Agent框架


Qwen-Agent是我们充分挖掘模型Agent能力的一个尝试,这一框架可最大程度地发挥Qwen模型在指令遵循、工具使用、规划及记忆等方面的强劲能力,并且内部封装了工具调用模板和解析器,原生支持 MCP 协议。通过使用 Qwen-Agent ,Qwen3模型可无缝调用成熟的MCP服务,Agent开发成本可大大降低。

在此,我们通过三个基于Qwen-Agent的CookBook示例,全面展示Qwen3的Agent能力:

1️⃣cookbook_database_manipulation实现自然语言驱动的数据库操作闭环(文件解析→数据入库→智能查询)

2️⃣cookbook_drive_guide深度融合云端高德API提供实时地理智能服务(路径规划/旅游推荐)

3️⃣cookbook_mind_map则能一键将文档转化为结构化思维导图。

仓库地址:

Qwen-Agent

CookBook

(1)(2)(3)


「文档转思维导图」示例

Step1:环境配置

打开终端或jupyter notebook中执行shell命令,进行第三方包安装和检查环境配置:

pip3 install -U "qwen-agent[gui,rag,code_interpreter,mcp]"
pip3 install -U uv
npm --version

#jupyter notebook使用命令:
!pip3 install -U "qwen-agent[gui,rag,code_interpreter,mcp]"
!pip3 install -U uv
!npm --version

Step2:创建示例文档

创建一个简单的示例文档:

document = '''
# Document

## Introduction
- Brief overview of the document's purpose and main topics.

## Background
- Historical context and previous research.
- Key theories and models discussed.

## Methodology
- Detailed description of the methods used in the study.
- Explanation of data collection and analysis techniques.

## Results
- Presentation of the findings from the research.
- Statistical analysis and graphical representations.

## Discussion
- Interpretation of the results.
- Comparison with previous studies.
- Limitations andfuture research directions.

## Conclusion
- Summary of the main points covered in the document.
- Final thoughts and implications of the research.
'''.strip()

with open('example_document.md', 'w', encoding='utf-8') as f:
    f.write(document)

Step3: 创建智能Agent

创建一个能够执行以下任务的智能Agent:

  • 列出、读取和写入文件(通过 MCP 服务器 @modelcontextprotocol/server-filesystem)。
  • 制作思维导图(通过 MCP 服务器 mindmap-mcp-server)。
from qwen_agent.agents import Assistant
from qwen_agent.utils.output_beautify import typewriter_print
#typewriter_print打印流式消息
llm_cfg = {
    'model': 'qwen3-32b',
    'model_server': 'dashscope',
    'api_key': '' # 填写百炼API-KEY

    # 使用与 OpenAI API 兼容的模型服务,例如 vLLM 或 Ollama:
    # 'model': 'Qwen3-8B',
    # 'model_server': 'http://localhost:8000/v1',  
    # 'api_key': 'EMPTY'
}

tools = [{
    "mcpServers": {
        "filesystem": {
            "command": "npx",
            "args": [
                "-y",
                "@modelcontextprotocol/server-filesystem",
                '.',
            ]
        },
        "mindmap": {
            "command": "uvx",
            "args": ["mindmap-mcp-server", "--return-type", "filePath"]
        }
    }
}]

agent = Assistant(
    llm=llm_cfg,
    function_list=tools
)

Step4:标题编号

我们在 Markdown 标题中添加数字:

messages = []
messages += [{"role": "user", "content": "Read the example_document.md file in the current folder. In your reply, show me the content with the second-level headings numbered. (example: ## heading -> ## 1. heading)"}]
response_plain_text = ''
for ret_messages in agent.run(messages):
    # ret_messages 将包含所有后续消息,由助手消息和工具响应组成
    response_plain_text = typewriter_print(ret_messages, response_plain_text)

640 (16).png

messages += ret_messages #将 ret_messages 历史上下对话信息中。

Step5:创建思维导图

接下来,我们通过Agent 创建一个思维导图,并显示存储路径:

messages += [{'role': 'user', 'content': 'Create a mind map with your previous markdown output. Show me the saved path.'}]
response_plain_text = ''

for ret_messages in agent.run(messages):
    response_plain_text = typewriter_print(ret_messages, response_plain_text)

640 (17).png

640 (18).png


更方便的Web UI可视化操作

我们已经探索了 Qwen-Agent 框架和 Qwen 模型对文档转换为思维导图的功能。我们不仅可以基于代码进行操作,也可以使用Web UI进行可视化操作。

我们通过下方的代码启动Web UI 服务:

from qwen_agent.gui import WebUI

agent = Assistant(
    name="Qwen Assistant",
    description="I'm a digital assistant powered by Qwen-Agent, ask me anything!",
    llm=llm_cfg,
    function_list=tools
)

WebUI(agent).run()

640 (19).png


欢迎体验

通过以上示例,我们完整展现了 Qwen-Agent 如何通过Qwen3调用 MCP Server服务。从文件读取、智能编号到思维导图转换,Qwen3展现出强大的对复杂任务的理解与执行能力。

我们还准备了另外两个示例,欢迎大家前往前文地址查看。更多MCP服务,也可通过魔搭社区MCP广场获取。

Qwen-Agent 的意义,不止于“能用”,更在于“好用”:它封装了模型调用、工具集成的关键环节,让开发者真正可以把更多精力放在“做什么”上,而不是“怎么做”。依托 Qwen3 在指令遵循、思维链规划、工具调用等方面的优势,Qwen-Agent 将Agent的开发门槛大幅降低。

我们将继续探索 Qwen 在现实场景中的更多可能性,欢迎大家上手体验并给我们反馈。

相关文章
|
4天前
|
机器学习/深度学习 监控 自动驾驶
基于YOLOv8的交通标识及设施识别项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
本项目基于YOLOv8与PyQt5,打造交通标识及设施智能识别系统。支持图像、视频、摄像头输入,可检测人行横道、限速标志、停车标志和交通信号灯。提供完整源码、数据集、权重文件与训练教程,开箱即用,适合多场景应用。系统具备高精度、实时性强、部署便捷等优势,助力智能交通与自动驾驶发展。
91 1
基于YOLOv8的交通标识及设施识别项目|完整源码数据集+PyQt5界面+完整训练流程+开箱即用!
|
4天前
|
人工智能 前端开发 Devops
通义灵码带你玩转开发者常用的MCP(合辑,持续更新中)
今天我们精选了与开发者息息相关和比较热门的MCP 服务,总结了这些技术服务在实际开发的最佳实践,涵盖了从前端开发、后端开发、DevOps、测试、运维等关键环节,及非研发领域中的热度较高的MCP服务。我们通过直播、图文等形式带你了解和学习!
594 3
|
4天前
|
开发框架 定位技术 API
AgentScope 与 MCP:实践、思考与展望
AgentScope 作为一款功能强大的开源多智能体开发框架,为开发者提供了智能体构建、工具使用、多智能体编排等全方位支持。
109 27
|
4天前
|
传感器 人工智能 自然语言处理
比亚迪座舱接入通义大模型,未来将联合打造更多AI智能座舱场景
比亚迪与阿里云深度合作,将通义大模型应用于智能座舱和营销服务。通过通义万相,腾势推出“AI壁纸”功能;借助通义星尘,实现“心理伴聊”等情感陪伴场景。阿里云Mobile-Agent智能体落地比亚迪座舱,支持复杂语音操作,如查询淘宝物流、订火车票等。该方案基于全视觉解决技术,具有强泛化能力,未来双方将持续拓展更多AI应用。
|
4天前
|
人工智能 自然语言处理 IDE
通义灵码 × Qwen3:编程智能体上线
通义灵码现已全面支持Qwen3,正式上线编程智能体。升级后的工具不再只是代码生成器,而是能理解任务的智能搭档,依托Qwen3能力结合MCP服务,自动感知项目结构、分析需求并调用多种工具完成编码任务。通过自然语言输入,开发者可在10分钟内完成原本需1~2天的App开发工作。此外,通义灵码支持工程级变更、自动上下文感知、工具自主使用及终端命令执行,深度集成3000+ MCP服务,覆盖DevOps全流程。目前插件下载量超1500万,累计生成代码超30亿行。体验只需将插件升级至2.5.0版本以上并在VS Code或JetBrains IDE中启用。
64 24
|
4天前
|
自然语言处理 并行计算 机器人
ParScale:一种全新的大模型Scaling Law
ParScale是一种新的模型扩展路线,通过并行计算增强模型能力,无需增加参数量。它引入多个并行流处理输入,动态聚合输出,显著提升性能,尤其在数学和编程任务中表现突出。相比传统方法,ParScale仅增加1/22的内存和1/6的延迟,适合边缘设备。研究还提出两阶段训练策略,降低训练成本。未来将探索更多模型架构和大数据场景下的应用潜力。
|
3天前
|
机器学习/深度学习 人工智能 城市大脑
大家之言|人工智能发展趋势与基础设施建设之路
中国AI技术发展已从跟跑转向基建领跑,“十四五”期间算力规模年均增速达27%。杭州城市大脑升级AI智能体集群,重庆部署超大城市治理系统,宁夏作为“东数西算”枢纽持续突破算力规模。专家梅建平指出,人工智能虽为核心驱动力,但需警惕过度期望,理性看待其局限性。国家提出“三步走”战略与“一体两翼”规划,推动算力基础设施建设,如“东数西算”和全国一体化算力网,以优化资源调度并促进数字经济高质量发展。
|
6月前
|
人工智能 开发框架 算法
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
Qwen-Agent 是阿里通义开源的一个基于 Qwen 模型的 Agent 应用开发框架,支持指令遵循、工具使用、规划和记忆能力,适用于构建复杂的智能代理应用。
2113 11
Qwen-Agent:阿里通义开源 AI Agent 应用开发框架,支持构建多智能体,具备自动记忆上下文等能力
|
4月前
|
SQL JSON 数据可视化
基于 DIFY 的自动化数据分析实战
本文介绍如何使用DIFY搭建数据分析自动化流程,实现从输入需求到查询数据库、LLM分析再到可视化输出的全流程。基于经典的employees数据集和DIFY云端环境,通过LLM-SQL解析、SQL执行、LLM数据分析及ECharts可视化等模块,高效完成数据分析任务。此方案适用于人力资源分析、薪酬管理等数据密集型业务,显著提升效率并降低成本。
8713 15
|
6月前
|
数据采集 前端开发 物联网
【项目实战】通过LLaMaFactory+Qwen2-VL-2B微调一个多模态医疗大模型
本文介绍了一个基于多模态大模型的医疗图像诊断项目。项目旨在通过训练一个医疗领域的多模态大模型,提高医生处理医学图像的效率,辅助诊断和治疗。作者以家中老人的脑部CT为例,展示了如何利用MedTrinity-25M数据集训练模型,经过数据准备、环境搭建、模型训练及微调、最终验证等步骤,成功使模型能够识别CT图像并给出具体的诊断意见,与专业医生的诊断结果高度吻合。
【项目实战】通过LLaMaFactory+Qwen2-VL-2B微调一个多模态医疗大模型