让数据查询又快又准,瓴羊Dataphin MCP保姆级教程来啦!

简介: 在AI Agent快速发展的背景下,优质数据资产成为提升AI生产力的核心。瓴羊Dataphin通过MCP(Model Context Protocol)服务助力企业高效挖掘数据价值。MCP采用SSE协议,提供listDataServiceAPI与invokeDataServiceAPI两种工具,简化数据集成与调用流程。例如,结合大模型可快速构建“智能查询助手”,实现自然语言查询数据功能。未来,Dataphin将持续迭代工具集,支持更多数据研发与治理场景。

在AI Agent蓬勃发展的当下,优质数据资产已然成为释放AI生产力的关键因素。

作为瓴羊旗下智能数据建设和治理工具——Dataphin拥有庞大的元数据知识,包括逻辑模型、资产元数据信息、业务知识(标准、指标、码表)等。为了帮助企业更好地挖掘数据资产,Dataphin推出MCP服务,助力Agent高效获取数据。

1. 什么是MCP?

MCP(Model Context Protocol)是由 Anthropic 公司提出的开源协议,旨在解决AI应用程序与外部数据源、应用的集成问题。在没有MCP之前,AI应用程序的开发者普遍通过Function Call的方式来与外部应用进行集成,常常会面临如下困境:

  • 开发复杂度高:需要在应用中通过硬编码的方式适配不同平台的API,每一个任务都需要单独开发和维护;
  • 复用性低:每个集成模块通常是为特定任务定制的,缺乏通用性和可移植性,难以在其他项目中复用;

MCP定义了为大模型提供上下文的接口标准,使其能够无缝连接各种外部应用的数据,可以通过插拔式的配置决定AI应用是否集成某个应用,大大降低了开发成本,提高了可复用性。

2. Dataphin MCP

Dataphin MCP采用SSE(Server-Sent Events)协议,如下是对应的JSON配置:

Dataphin MCP目前提供两个与数据服务相关的Tools,分别为:

  • listDataServiceAPI: 根据所提供的应用,获取有权限调用的数据服务API信息,包括API ID、输入和输出参数、API调用文档等
  • invokeDataServiceAPI:调用数据服务API来获取数据

3. 场景举例

对于企业开发人员,可以通过Dataphin数据服务API来获取商品、用户、订单等数据。举个例子,现在公司计划开发一款移动端的信息查询工具,以支持运营同学随时随地查询用户信息、订单数据等。

您可以通过 “大模型” + “Dataphin MCP” 的方式,快速构建数据查询助手。

演示如下:

1. 创建一个“智能查询助手”,关联Dataphin MCP服务,图中以百炼为例:

2. 在右侧输入您的问题测试模型效果,如输入:“帮我查询今年所有品类的销售额,同时查询销售额第一的品类中单品销量Top1”

   a. 首先,模型会调用listDataServiceAPI这个Tool以查询所有可调用的API;

   b. 然后,模型会根据可用的API名称、描述、入参等信息,规划出为了解决当前用户问题需要调用哪些API。

在本问题中,模型从众多API中选择了两个API进行调用,并将调用结果呈现给用户,分别是:QueryTransactionByProductCategory(根据产品品类查询总交易额)和QueryProductSaleInCat(查询指定品类下每个商品的销售额)。

image.png

*以上均为模拟演示数据,不具备实际意义

4. 结语

未来,瓴羊Dataphin将持续丰富和迭代MCP Server的工具集,包括数据研发、任务运维、数据治理等,有了这些工具您将可以通过自然语言体验更多场景:

  • 查询项目A中的任务运行状态,并对失败实例进行批量重跑;
  • 在项目A中创建一个集成任务,其中数据来源于MySQL数据库test_mysql的表customer,同步到项目计算源中,并一键建表;
  • 创建一个规则强度为弱的质量规则,要求被监控字段需要满足国内有效的电话号码格式,同时将表customer的字段 phone作为监控对象;



来源  |  瓴羊DaaS公众号

相关文章
|
4天前
|
分布式计算 DataWorks 数据处理
在数据浪潮中前行:记录一次我与ODPS的实践、思考与展望
本文详细介绍了在 AI 时代背景下,如何利用阿里云 ODPS 平台(尤其是 MaxCompute)进行分布式多模态数据处理的实践过程。内容涵盖技术架构解析、完整操作流程、实际部署步骤以及未来发展方向,同时结合 CSDN 博文深入探讨了多模态数据处理的技术挑战与创新路径,为企业提供高效、低成本的大规模数据处理方案。
39 2
|
安全 测试技术 开发工具
Git分支和标签的命名规范
四个环境分别是:dev、test、pre、pro(master),中文名字:开发环境、测试环境、灰度环境、生产环境 dev环境:开发环境,外部用户无法访问,开发人员使用,版本变动很大。 test环境:测试环境,外部用户无法访问,专门给测试人员使用的,版本相对稳定 pre环境:灰度环境,外部用户可以访问,但是服务器配置相对低,其它和生产一样。 pro(master)环境:生产环境,面向外部用户的环境,连接上互联网即可访问的正式环境
|
2月前
|
人工智能 JSON 运维
Dataphin MCP:让数据查询 “轻而易举”
Dataphin推出MCP服务,助力Agent高效获取数据,释放企业数据价值。
279 10
|
存储 Kubernetes Cloud Native
一文读懂容器存储接口 CSI
在《一文读懂 K8s 持久化存储流程》一文我们重点介绍了 K8s 内部的存储流程,以及 PV、PVC、StorageClass、Kubelet 等之间的调用关系。接下来本文将将重点放在 CSI(Container Storage Interface)容器存储接口上,探究什么是 CSI 及其内部工作原理。
一文读懂容器存储接口 CSI
|
Java
规则引擎选型及应用
规则引擎具体执行可以分为接受数据输入,解释业务规则,根据业务规则做出业务决策几个过程。 使用规则引擎可以把复杂、冗余的业务规则同整个支撑系统分离开,做到架构的可复用移植。
24253 0
|
2月前
|
人工智能 Java 程序员
JManus - 面向 Java 开发者的开源通用智能体
JManus 是一个以 Java 为核心、完全开源的 OpenManus 实现,隶属于 Spring AI Alibaba 项目。它旨在让 Java 程序员更便捷地使用 AI 技术,支持多 Agent 框架、网页配置 Agent、MCP 协议和 PLAN-ACT 模式。项目在 GitHub 上已获近 3k star,可集成多个大模型如 Claude 3.5 和 Qwen3。开发者可通过 IDE 或 Maven 快速运行项目,体验智能问答与工具调用功能。欢迎参与开源共建,推动通用 AI Agent 框架发展。
5069 62
|
3天前
|
人工智能 分布式计算 DataWorks
阿里云ODPS多模态数据处理实战:MaxFrame的分布式AI数据管道构建
初次接触MaxCompute时,我被其强大的分布式计算能力所震撼,但真正让我深度依赖这套生态的转折点,是在一次处理百万级图像数据集的项目中。当时我们面临的挑战是如何在有限的时间内完成大规模图像特征提取和模型训练,传统的单机处理方案显然无法胜任。经过深入调研,我们选择了MaxCompute的Object Table功能来管理非结构化数据,配合MaxFrame进行分布式计算,整个处理流程的效率提升了300%以上。 在随后的几年实践中,我逐渐发现ODPS不仅仅是一个大数据处理平台,更是一个完整的数据生态系统。从DataWorks的可视化开发环境,到Hologres的实时查询能力,再到MaxCompu
28 2
阿里云ODPS多模态数据处理实战:MaxFrame的分布式AI数据管道构建
|
14天前
|
Java 计算机视觉
微信虚拟视频聊天插件,QQ抖音快手虚拟摄像头工具,替换相机视频流java
实现包含了虚拟摄像头核心功能,可以捕获真实摄像头视频流,处理后输出到虚拟摄像头设备。