云上玩转Qwen3系列之三:PAI-LangStudio x Hologres构建ChatBI数据分析Agent应用

本文涉及的产品
模型在线服务 PAI-EAS,A10/V100等 500元 1个月
模型训练 PAI-DLC,100CU*H 3个月
交互式建模 PAI-DSW,每月250计算时 3个月
简介: PAI-LangStudio 和 Qwen3 构建基于 MCP 协议的 Hologres ChatBI 智能 Agent 应用,通过将 Agent、MCP Server 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中,为大模型提供了 MCP+OLAP 的智能数据分析能力,使用自然语言即可实现 OLAP 数据分析的查询效果,减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发,以满足特定场景的需求。

本文详细介绍了如何使用 PAI-LangStudio 和 Qwen3 构建基于 MCP 协议的 Hologres ChatBI 智能 Agent 应用。该应用通过将 Agent、MCP Server 等技术和阿里最新的推理模型 Qwen3 编排在一个应用流中,为大模型提供了 MCP+OLAP 的智能数据分析能力,使用自然语言即可实现 OLAP 数据分析的查询效果,减少了幻觉。开发者可以基于该模板进行灵活扩展和二次开发,以满足特定场景的需求。



一、背景信息

Qwen3

Qwen3 作为 Qwen 系列最新一代的大语言模型,提供了一系列密集(Dense)和混合专家 (MOE)模型。基于广泛的训练,Qwen3 在推理、指令跟随、代理能力和多语言支持方面取得了突破性的进展,具有以下关键特性:

  • 独特支持在思考模式(用于复杂逻辑推理、数学和编码)和 非思考模式(用于高效通用对话)之间无缝切换,确保在各种场景下的最佳性能
  • 显著增强的推理能力,在数学、代码生成和常识逻辑推理方面超越了之前的 QWQ (在思考模式下)和 Qwen2.5 指令模型(在非思考模式下)。
  • 擅长 Agent 能力,可以在思考和非思考模式下精确集成外部工具,在复杂的基于代理的任务中在开源模型中表现领先。可与 LangStudio 大模型开发平台无缝集成:结合 MCP Server 服务,增强智能数据分析能力
  • 支持100多种语言和方言,具有强大的多语言理解、推理、指令跟随和生成能力。


PAI-LangStudio - 大模型应用开发平台

大模型& Agent 应用开发平台(PAI-LangStudio)是依托阿里云 PAI 产品核心能力构建的面向企业级用户的一站式大模型应用开发平台。简化了企业级大模型应用的开发流程,同时提供了灵活的可编程能力、实时调试能力与链路追踪的能力,帮助开发者快速构建端到端的 AI 应用。原生兼容支持通义系列 Qwen 系列大模型。LangStudio 专注于提供 LLM 全链路开发部署能力,支持发布有状态、多 Agent 的复杂工作流发布部署成 PAI-EAS 模型服务,并在生产环境提供 API 应用服务

LangStudio Agent 智能体支持调用 MCP Server 通过 HTTP with SSE 或 Streamable HTTP 传输方式使用 MCP 协议来发现和调用工具 Tool Use。


MCP - 大模型协议

模型上下文协议(Model Context Protocol,MCP)是 Anthropic 于 2024 年推出的开源标准,旨在解决大模型与外部工具、数据源的集成难题。其核心作用是通过标准化接口架构,将 AI 模型的决策逻辑与外部资源解耦,形成 "智能大脑 + 外接四肢" 的协同模式。


Hologres - 实时数仓

Hologres 是阿里云自研一站式实时数仓产品,不仅支持海量数据多维分析(OLAP)、高并发低延迟的在线数据服务(Serving),还与达摩院自研高性能向量计算软件库 Proxima 深度整合,支持高性能、低延时、简单易用的向量计算能力。

Hologres MCP Server

Hologres MCP 服务器作为 AI 代理与 Hologres 数据库之间的通用接口,支持 AI 代理与 Hologres 之间的无缝通信,帮助 AI 代理获取 Hologres 数据库元数据并执行 SQL 操作。



二、前提条件

  • 已创建专有网络 VPC、交换机和安全组。具体操作,请参见搭建 IPv4 专有网络创建安全组。需将 Hologres  MCP Server 实例和 LangStudio Agent 运行时配置于同一 Region 内。
  • 对接阿里云 Function AI MCP 服务- Hologres MCP Server
  • 登录 PAI 控制台,在左侧导航栏单击工作空间列表(如无 已有工作空间列表)。在工作空间列表页面中单击待操作的工作空间名称,进入对应工作空间内。如您尚未创建工作空间,请创建工作空间


三、LangStudio 应用流方案-企业部署步骤


步骤一:Model Gallery 部署 Qwen3 模型设置

1. 进入 PAI 控制台 > Model Gallery,选择大语言模型场景。

image.png

2. 根据业务场景选择部署合适的 Qwen3 模型,此实践中选择 Qwen3-8B。  

  • 以下是 Qwen3 系列不同模型的建议配置信息

image.png

  • Agent 节点需要使用到模型的工具调用能力,部署时需要参考模型文档确认打开 tool call 配置,以 SGLang 部署 Qwen3-8B 为例,在启动命令中增加相关配置:

image.png

  • 以下状态表示部署正在进行中:

image.png

3. 单击查看调用信息录部署后的服务访问地址(`base_url`)及 API Token(`api_key`)。  

步骤二:Hologres MCP Server 搭建应用



1. 根据参考手册创建 Hologres 实例(可使用现有 Hologres 实例)

2. 创建 Hologres 数据库,参考手册导入样例数据

3. 登录阿里云-函数计算管控台参考文档创建 Holo MCP Server 服务

image.png

4. 选择 Region,选择访问 Hologres 实例的 RAM Role,填写 Hologres 实例的 Endpoint 端口和数据库,点击部署项目

image.png


5. 项目部署完成后,即生成一个 MCP SSE (Server-Sent Events) 服务

  • 可以在访问地址处找到 MCP SSE 模式对应的 Endpoint

image.png

  • 在配置处找到 SSE 连接所需的 Bearer Token

image.png

6. 为选择的 RAM 赋予数据的查询权限

  • 请参考 Hologres 权限模型,并连接 HoloWeb 检查相应权限。
  • 如果只是查询数据,推荐使用简单权限模型,并对 RAM Role 的账号授予 viewer 权限即可。

步骤三:LangStudio 使用模板构建数据分析 Hologres ChatBI Agent

  1. 在 LangStudio > 新建运行时实例,Agent 智能体的运行调试依赖运行时 Runtime。

image.png

2. 通过 PAI 控制台 > 进入 LangStudio > 新建连接 > 连接类型-通用 LLM 模型服务连接 > 服务提供方- PAI-EAS 模型服务,单击<确定>。

image.png

3. 通过 PAI 控制台 > 进入 LangStudio > 新建应用流 > 新建方式-从模板新建 > 选择模版-智能数据 Agent,单击<确定>。

image.png

确保函数计算对应的 MCP Server 与 LangStudio 属于在同一 Region。否则会导致 VPC 网络不通。

4. 在应用流看板上,完成数据分析 Agent 相关设置。详见 Agent 文档

  • 选择 Agent 策略:FunctionCalling
  • 模型设置:选择步骤2中创建的模型连接
  • 打开对话历史

image.png

  • 按照如下模板配置 MCP 服务配置 (SSE 的域名 Endpoint / Bearer Token)
{
    "mcpServers": {
        "remote-server": {
            "type": "sse",
            "url": "https://xxx.xxx.run/sse",
            "headers": {
                "Authorization": "Bearer xxxx"
            },
            "timeout": 30
        }
    }
}
  • 设置输入变量信息,包括系统提示词USER prompt最大循环次数设置为5次,可以根据需要调整。

image.png


步骤四:通过 LangStudio 运行对话框架进行 Chat 数据分析验证

我们尝试一些问题

MCP 提供了哪些工具呢

image.png

帮我看下数量最多的TOP10的客户

image.png

步骤五:通过 LangStudio 部署 EAS 模型服务,支持 API 调用模型推理能力

image.png

用流开发调试完成后,单击右上角的部署根据需要选择合适的机型以及专有网络,注意 EAS 实例需要使用与应用流中其他服务实例相同的 VPC,以保证安全和网络连通。点击确定 > 跳转到 PAI-EAS 模型服务 查看部署任务。

通过以上步骤,您可快速使用 LangStudio 构建基于 Qwen3 和 Hologres MCP Server 实现智能数据分析 ChatBI Agent 应用,满足专业分析场景需求。

相关链接

相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
相关文章
|
机器学习/深度学习 人工智能 自然语言处理
构建企业级数据分析助手:Data Agent 开发实践
本篇将介绍DMS的一款数据分析智能体(Data Agent for Analytics )产品的技术思考和实践。Data Agent for Analytics 定位为一款企业级数据分析智能体, 基于Agentic AI 技术,帮助用户查数据、做分析、生成报告、深入洞察。由于不同产品的演进路径,背景都不一样,所以只介绍最核心的部分,来深入剖析如何构建企业级数据分析助手:能力边界定义,技术内核,企业级能力。希望既能作为Data Agent for Analytics产品的技术核心介绍,也能作为读者的开发实践的参考。
560 1
构建企业级数据分析助手:Data Agent 开发实践
|
4月前
|
监控 安全 数据挖掘
构建自定义电商数据分析API
在电商业务中,构建自定义数据分析API可实现销售、用户行为等指标的实时分析。本文介绍如何设计并搭建高效、可扩展的API,助力企业快速响应市场变化,提升决策效率。
145 0
|
6月前
|
机器学习/深度学习 人工智能 自然语言处理
Cosmos on PAI系列一:PAI-Model Gallery云上一键部署NVIDIA Cosmos Reason-1
本篇文章介绍 Cosmos 最新世界基础模型 Cosmos Reason-1 如何在阿里云人工智能平台 PAI 上进行快速部署使用。
|
4月前
|
存储 传感器 数据采集
什么是实时数仓?实时数仓又有哪些应用场景?
实时数仓是一种能实现秒级数据更新和分析的系统,适用于电商、金融、物流等需要快速响应的场景。相比传统数仓,它具备更高的时效性和并发处理能力,能够帮助企业及时捕捉业务动态,提升决策效率。本文详细解析了其实现架构与核心特点,并结合实际案例说明其应用价值。
|
4月前
|
自然语言处理 安全 数据挖掘
MCP 如何构建企业级数据分析 Agent?
阿里云实时数仓 Hologres,联合函数计算 FC 推出「Hologres + 函数计算 FunctionAI + Qwen 构建企业级数据分析 Agent」方案,帮助用户快速对接 MCP,高效跨越企业级数据分析 Agent 构建困境。
|
5月前
|
SQL 存储 缓存
基于 StarRocks + Iceberg,TRM Labs 构建 PB 级数据分析平台实践
从 BigQuery 到开放数据湖,区块链情报公司 TRM Labs 的数据平台演进实践
|
5月前
|
人工智能 运维 数据挖掘
一站式智能分析引擎,快速构建企业级数据分析 Agent
本文介绍了一种基于阿里云实时数仓 Hologres 和百炼大模型服务的智能数据分析解决方案。通过 Function AI 提供的 Serverless 平台,企业可快速构建从多源数据接入到业务洞察的端到端流程。方案支持实时数据分析、湖仓直连加速、智能预处理及按需付费模式,大幅降低运维成本并提升效率。同时,文章详细描述了实践部署步骤,包括专有网络配置、Hologres 实例创建、公共数据集导入及应用部署验证等环节,并提供了资源清理指南与参考链接,确保用户能够顺利实施和管理方案。
235 18
|
5月前
|
机器学习/深度学习 人工智能 自然语言处理
【新模型速递】PAI-Model Gallery云上一键部署MiniMax-M1模型
MiniMax公司6月17日推出4560亿参数大模型M1,采用混合专家架构和闪电注意力机制,支持百万级上下文处理,高效的计算特性使其特别适合需要处理长输入和广泛思考的复杂任务。阿里云PAI-ModelGallery现已接入该模型,提供一键部署、API调用等企业级解决方案,简化AI开发流程。
|
机器学习/深度学习 数据采集 数据可视化
基于爬虫和机器学习的招聘数据分析与可视化系统,python django框架,前端bootstrap,机器学习有八种带有可视化大屏和后台
本文介绍了一个基于Python Django框架和Bootstrap前端技术,集成了机器学习算法和数据可视化的招聘数据分析与可视化系统,该系统通过爬虫技术获取职位信息,并使用多种机器学习模型进行薪资预测、职位匹配和趋势分析,提供了一个直观的可视化大屏和后台管理系统,以优化招聘策略并提升决策质量。
823 4

热门文章

最新文章

相关产品

  • 人工智能平台 PAI
  • 下一篇
    oss云网关配置