云上玩转Qwen3系列之三:PAI-LangStudio x Hologres构建ChatBI数据分析Agent应用

本文涉及的产品
交互式建模 PAI-DSW,每月250计算时 3个月
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
简介: PAI-LangStudio 和 Qwen3 构建基于 MCP 协议的 Hologres ChatBI 智能 Agent 应用,通过将 Agent、MCP Server 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中,为大模型提供了 MCP+OLAP 的智能数据分析能力,使用自然语言即可实现 OLAP 数据分析的查询效果,减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发,以满足特定场景的需求。

本文详细介绍了如何使用 PAI-LangStudio 和 Qwen3 构建基于 MCP 协议的 Hologres ChatBI 智能 Agent 应用。该应用通过将 Agent、MCP Server 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中,为大模型提供了 MCP+OLAP 的智能数据分析能力,使用自然语言即可实现 OLAP 数据分析的查询效果,减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发,以满足特定场景的需求。



一、背景信息

Qwen3

Qwen3 作为 Qwen 系列最新一代的大语言模型,提供了一系列密集(Dense)和混合专家 (MOE)模型。基于广泛的训练,Qwen3 在推理、指令跟随、代理能力和多语言支持方面取得了突破性的进展,具有以下关键特性:

  • 独特支持在思考模式(用于复杂逻辑推理、数学和编码)和 非思考模式(用于高效通用对话)之间无缝切换,确保在各种场景下的最佳性能
  • 显著增强的推理能力,在数学、代码生成和常识逻辑推理方面超越了之前的 QWQ (在思考模式下)和 Qwen2.5 指令模型(在非思考模式下)。
  • 擅长 Agent 能力,可以在思考和非思考模式下精确集成外部工具,在复杂的基于代理的任务中在开源模型中表现领先。可与 LangStudio 大模型开发平台无缝集成:结合 MCP Server 服务,增强智能数据分析能力
  • 支持100多种语言和方言,具有强大的多语言理解、推理、指令跟随和生成能力。


PAI-LangStudio - 大模型应用开发平台

大模型& Agent 应用开发平台(PAI-LangStudio)是依托阿里云 PAI 产品核心能力构建的面向企业级用户的一站式大模型应用开发平台。简化了企业级大模型应用的开发流程,同时提供了灵活的可编程能力、实时调试能力与链路追踪的能力,帮助开发者快速构建端到端的 AI 应用。原生兼容支持通义系列 Qwen 系列大模型。LangStudio 专注于提供 LLM 全链路开发部署能力,支持发布有状态、多 Agent 的复杂工作流发布部署成 PAI-EAS 模型服务,并在生产环境提供 API 应用服务

LangStudio Agent 智能体支持调用 MCP Server 通过 HTTP with SSE 或 Streamable HTTP 传输方式使用 MCP 协议来发现和调用工具 Tool Use。


MCP - 大模型协议

模型上下文协议(Model Context Protocol,MCP)是 Anthropic 于 2024 年推出的开源标准,旨在解决大模型与外部工具、数据源的集成难题。其核心作用是通过标准化接口架构,将 AI 模型的决策逻辑与外部资源解耦,形成 "智能大脑 + 外接四肢" 的协同模式。


Hologres - 实时数仓

Hologres 是阿里云自研一站式实时数仓产品,不仅支持海量数据多维分析(OLAP)、高并发低延迟的在线数据服务(Serving),还与达摩院自研高性能向量计算软件库 Proxima 深度整合,支持高性能、低延时、简单易用的向量计算能力。

Hologres MCP Server

Hologres MCP 服务器作为 AI 代理与 Hologres 数据库之间的通用接口,支持 AI 代理与 Hologres 之间的无缝通信,帮助 AI 代理获取 Hologres 数据库元数据并执行 SQL 操作。



二、前提条件

  • 已创建专有网络 VPC、交换机和安全组。具体操作,请参见搭建 IPv4 专有网络创建安全组。需将 Hologres  MCP Server 实例和 LangStudio Agent 运行时配置于同一 Region 内。
  • 对接阿里云 Function AI MCP 服务- Hologres MCP Server
  • 登录 PAI 控制台,在左侧导航栏单击工作空间列表(如无 已有工作空间列表)。在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。如您尚未创建工作空间,请创建工作空间


三、LangStudio 应用流方案-企业部署步骤


步骤一:Model Gallery 部署 Qwen3 模型设置

1. 进入 PAI 控制台 > Model Gallery,选择大语言模型场景。

image.png

2. 根据业务场景选择部署合适的 Qwen3 模型,此实践中选择 Qwen3-8B。  

  • 以下是 Qwen3 系列不同模型的建议配置信息

image.png

  • Agent 节点需要使用到模型的工具调用能力,部署时需要参考模型文档确认打开 tool call 配置,以 SGLang 部署 Qwen3-8B 为例,在启动命令中增加相关配置:

image.png

  • 以下状态表示部署正在进行中:

image.png

3. 单击查看调用信息录部署后的服务访问地址(`base_url`)及 API Token(`api_key`)。  

步骤二:Hologres MCP Server 搭建应用



1. 根据参考手册创建 Hologres 实例(可使用现有 Hologres 实例)

2. 创建 Hologres 数据库,参考手册导入样例数据

3. 登录阿里云-函数计算管控台参考文档创建 Holo MCP Server 服务

image.png

4. 选择 Region,选择访问 Hologres 实例的 RAM Role,填写 Hologres 实例的 Endpoint 端口和数据库,点击部署项目

image.png


5. 项目部署完成后,即生成一个 MCP SSE (Server-Sent Events) 服务

  • 可以在访问地址处找到 MCP SSE 模式对应的 Endpoint

image.png

  • 在配置处找到 SSE 连接所需的 Bearer Token

image.png

6. 为选择的 RAM 赋予数据的查询权限

  • 请参考 Hologres 权限模型,并连接 HoloWeb 检查相应权限。
  • 如果只是查询数据,推荐使用简单权限模型,并对 RAM Role 的账号授予 viewer 权限即可。

步骤三:LangStudio 使用模板构建数据分析 Hologres ChatBI Agent

  1. 在 LangStudio > 新建运行时实例,Agent 智能体的运行调试依赖运行时 Runtime。

image.png

2. 通过 PAI 控制台 > 进入 LangStudio > 新建连接 > 连接类型-通用 LLM 模型服务连接 > 服务提供方- PAI-EAS 模型服务,单击<确定>。

image.png

3. 通过 PAI 控制台 > 进入 LangStudio > 新建应用流 > 新建方式-从模板新建 > 选择模版-智能数据 Agent,单击<确定>。

image.png

确保函数计算对应的 MCP Server 与 LangStudio 属于在同一 Region。否则会导致 VPC 网络不通。

4. 在应用流看板上,完成数据分析 Agent 相关设置。详见 Agent 文档

  • 选择 Agent 策略:FunctionCalling
  • 模型设置:选择步骤2中创建的模型连接
  • 打开对话历史

image.png

  • 按照如下模板配置 MCP 服务配置 (SSE 的域名 Endpoint / Bearer Token)
{
    "mcpServers": {
        "remote-server": {
            "type": "sse",
            "url": "https://xxx.xxx.run/sse",
            "headers": {
                "Authorization": "Bearer xxxx"
            },
            "timeout": 30
        }
    }
}
  • 设置输入变量信息,包括系统提示词USER prompt最大循环次数设置为5次,可以根据需要调整。

image.png


步骤四:通过 LangStudio 运行对话框架进行 Chat 数据分析验证

我们尝试一些问题

MCP 提供了哪些工具呢

image.png

帮我看下数量最多的TOP10的客户

image.png

步骤五:通过 LangStudio 部署 EAS 模型服务,支持 API 调用模型推理能力

image.png

用流开发调试完成后,单击右上角的部署根据需要选择合适的机型以及专有网络,注意 EAS 实例需要使用与应用流中其他服务实例相同的 VPC,以保证安全和网络连通。点击确定 > 跳转到 PAI-EAS 模型服务 查看部署任务。

通过以上步骤,您可快速使用 LangStudio 构建基于 Qwen3 和 Hologres MCP Server 实现智能数据分析 ChatBI Agent 应用,满足专业分析场景需求。

相关链接

相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
相关文章
|
14天前
|
机器学习/深度学习 人工智能 计算机视觉
让AI真正"看懂"世界:多模态表征空间构建秘籍
本文深入解析多模态学习的两大核心难题:多模态对齐与多模态融合,探讨如何让AI理解并关联图像、文字、声音等异构数据,实现类似人类的综合认知能力。
99 6
|
6天前
|
机器学习/深度学习 人工智能 前端开发
通义DeepResearch全面开源!同步分享可落地的高阶Agent构建方法论
通义研究团队开源发布通义 DeepResearch —— 首个在性能上可与 OpenAI DeepResearch 相媲美、并在多项权威基准测试中取得领先表现的全开源 Web Agent。
854 12
|
4天前
|
人工智能 自然语言处理 算法
现代AI工具深度解析:从GPT到多模态的技术革命与实战应用
蒋星熠Jaxonic,AI技术探索者,深耕代码生成、多模态AI与提示词工程。分享AI工具架构、实战应用与优化策略,助力开发者提升效率,共赴智能编程新纪元。
23 4
|
7天前
|
人工智能 算法 数据挖掘
AI Agent工作流实用手册:5种常见模式的实现与应用,助力生产环境稳定性
本文介绍了五种AI Agent结构化工作流模式,帮助解决传统提示词方式在生产环境中输出不稳定、质量不可控的问题。通过串行链式处理、智能路由、并行处理、编排器-工作器架构和评估器-优化器循环,可提升任务执行效率、资源利用和输出质量,适用于复杂、高要求的AI应用。
134 0
AI Agent工作流实用手册:5种常见模式的实现与应用,助力生产环境稳定性
|
1月前
|
人工智能 前端开发 数据库
波动跃迁:基于 Knative 加速 AI Agent 应用落地
Knative 提供了基于请求自动弹性、缩容到 0 以及多版本管理的 Serverless 能力,看如何助力 AI Agent 初创企业快速产品落地。
|
机器学习/深度学习 数据采集 数据可视化
基于爬虫和机器学习的招聘数据分析与可视化系统,python django框架,前端bootstrap,机器学习有八种带有可视化大屏和后台
本文介绍了一个基于Python Django框架和Bootstrap前端技术,集成了机器学习算法和数据可视化的招聘数据分析与可视化系统,该系统通过爬虫技术获取职位信息,并使用多种机器学习模型进行薪资预测、职位匹配和趋势分析,提供了一个直观的可视化大屏和后台管理系统,以优化招聘策略并提升决策质量。
729 4
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
在数字化时代,数据分析至关重要,而Python凭借其强大的数据处理能力和丰富的库支持,已成为该领域的首选工具。Python作为基石,提供简洁语法和全面功能,适用于从数据预处理到高级分析的各种任务。Pandas库则像是神兵利器,其DataFrame结构让表格型数据的处理变得简单高效,支持数据的增删改查及复杂变换。配合Matplotlib这一数据可视化的魔法棒,能以直观图表展现数据分析结果。掌握这三大神器,你也能成为数据分析领域的高手!
220 2
|
机器学习/深度学习 算法 数据挖掘
2023 年第二届钉钉杯大学生大数据挑战赛初赛 初赛 A:智能手机用户监测数据分析 问题二分类与回归问题Python代码分析
本文介绍了2023年第二届钉钉杯大学生大数据挑战赛初赛A题的Python代码分析,涉及智能手机用户监测数据分析中的聚类分析和APP使用情况的分类与回归问题。
271 0
2023 年第二届钉钉杯大学生大数据挑战赛初赛 初赛 A:智能手机用户监测数据分析 问题二分类与回归问题Python代码分析

相关产品

  • 人工智能平台 PAI