让数据查询又快又准,瓴羊Dataphin MCP保姆级教程来啦!

简介: 在AI Agent快速发展的背景下,优质数据资产成为提升AI生产力的核心。瓴羊Dataphin通过MCP(Model Context Protocol)服务助力企业高效挖掘数据价值。MCP采用SSE协议,提供listDataServiceAPI与invokeDataServiceAPI两种工具,简化数据集成与调用流程。例如,结合大模型可快速构建“智能查询助手”,实现自然语言查询数据功能。未来,Dataphin将持续迭代工具集,支持更多数据研发与治理场景。

在AI Agent蓬勃发展的当下,优质数据资产已然成为释放AI生产力的关键因素。

作为瓴羊旗下智能数据建设和治理工具——Dataphin拥有庞大的元数据知识,包括逻辑模型、资产元数据信息、业务知识(标准、指标、码表)等。为了帮助企业更好地挖掘数据资产,Dataphin推出MCP服务,助力Agent高效获取数据。

1. 什么是MCP?

MCP(Model Context Protocol)是由 Anthropic 公司提出的开源协议,旨在解决AI应用程序与外部数据源、应用的集成问题。在没有MCP之前,AI应用程序的开发者普遍通过Function Call的方式来与外部应用进行集成,常常会面临如下困境:

  • 开发复杂度高:需要在应用中通过硬编码的方式适配不同平台的API,每一个任务都需要单独开发和维护;
  • 复用性低:每个集成模块通常是为特定任务定制的,缺乏通用性和可移植性,难以在其他项目中复用;

MCP定义了为大模型提供上下文的接口标准,使其能够无缝连接各种外部应用的数据,可以通过插拔式的配置决定AI应用是否集成某个应用,大大降低了开发成本,提高了可复用性。

2. Dataphin MCP

Dataphin MCP采用SSE(Server-Sent Events)协议,如下是对应的JSON配置:

Dataphin MCP目前提供两个与数据服务相关的Tools,分别为:

  • listDataServiceAPI: 根据所提供的应用,获取有权限调用的数据服务API信息,包括API ID、输入和输出参数、API调用文档等
  • invokeDataServiceAPI:调用数据服务API来获取数据

3. 场景举例

对于企业开发人员,可以通过Dataphin数据服务API来获取商品、用户、订单等数据。举个例子,现在公司计划开发一款移动端的信息查询工具,以支持运营同学随时随地查询用户信息、订单数据等。

您可以通过 “大模型” + “Dataphin MCP” 的方式,快速构建数据查询助手。

演示如下:

1. 创建一个“智能查询助手”,关联Dataphin MCP服务,图中以百炼为例:

2. 在右侧输入您的问题测试模型效果,如输入:“帮我查询今年所有品类的销售额,同时查询销售额第一的品类中单品销量Top1”

   a. 首先,模型会调用listDataServiceAPI这个Tool以查询所有可调用的API;

   b. 然后,模型会根据可用的API名称、描述、入参等信息,规划出为了解决当前用户问题需要调用哪些API。

在本问题中,模型从众多API中选择了两个API进行调用,并将调用结果呈现给用户,分别是:QueryTransactionByProductCategory(根据产品品类查询总交易额)和QueryProductSaleInCat(查询指定品类下每个商品的销售额)。

image.png

*以上均为模拟演示数据,不具备实际意义

4. 结语

未来,瓴羊Dataphin将持续丰富和迭代MCP Server的工具集,包括数据研发、任务运维、数据治理等,有了这些工具您将可以通过自然语言体验更多场景:

  • 查询项目A中的任务运行状态,并对失败实例进行批量重跑;
  • 在项目A中创建一个集成任务,其中数据来源于MySQL数据库test_mysql的表customer,同步到项目计算源中,并一键建表;
  • 创建一个规则强度为弱的质量规则,要求被监控字段需要满足国内有效的电话号码格式,同时将表customer的字段 phone作为监控对象;



来源  |  瓴羊DaaS公众号

相关文章
|
SQL 存储 数据采集
【技术分享】元数据与数据血缘实现思路
【技术分享】元数据与数据血缘实现思路
7921 0
|
人工智能 JSON 运维
Dataphin MCP:让数据查询 “轻而易举”
Dataphin推出MCP服务,助力Agent高效获取数据,释放企业数据价值。
974 10
|
6月前
|
SQL 关系型数据库 MySQL
释放数据潜能,加速业务创新 —— Dataphin 5.4 新增删改API功能
Dataphin 5.4推出数据增删改API功能,支持通过配置SQL快速生成安全、可管理的CRUD接口,覆盖AI编程、数据集成、低代码等场景,降低开发成本,提升数据治理与安全性,助力企业高效释放数据价值。
422 0
|
8月前
|
SQL 分布式计算 关系型数据库
Dataphin x Paimon 开箱即用的数据湖治理解决方案
Dataphin深度集成Apache Paimon,通过全链路功能适配和性能优化,为企业提供开箱即用的数据湖治理解决方案。
481 2
|
SQL 人工智能 分布式计算
【产品升级】Dataphin V5.3 全新上线:四大能力升级,数据管理更统一、更智能!
V5.3版本,Dataphin推出众多重磅功能:例如,全新的智能应用:X-数据标准、X-数据安全以及智能应用反馈看板;更前沿的数据研发能力:利用SelectDB/Doris/StarRocks查询加速Hive和MaxCompute的离线引擎、全面支持Paimon格式的数据湖构建;资产运营和数据服务持续提效。
736 0
|
关系型数据库 数据挖掘 分布式数据库
数据库+MCP,0编码自主完成数据洞察
本文介绍了一种全新的数据分析方案,结合PolarDB MySQL版与阿里云百炼,搭配MCP工具实现智能数据库分析应用。该方案解决传统数据分析工具高门槛、低效率的问题,通过零SQL操作和一站式部署,助力企业快速挖掘数据价值。方案具备高性能查询、快响应直连加速、高安全保障及易迁移上云等优势,并详细说明了部署资源、应用配置及验证步骤,帮助用户轻松完成实践体验。
1899 15
|
10月前
|
数据可视化 Java 数据库连接
Dataphin JDBC:助您实现数据权限的集中管理
Dataphin JDBC提供了统一访问Dataphin中数据的功能,助您实现数据权限的集中式管理。
455 3
|
传感器 人工智能 自然语言处理
火热邀测!DataWorks数据集成支持大模型AI处理
阿里云DataWorks数据集成新增大模型AI处理功能,支持在数据同步中无缝调用通义千问等AI模型,实现文本翻译、情感分析、摘要生成等功能。适用于电商客服、智能汽车、供应链、医疗、金融、法律及教育等多个场景,大幅提升数据处理效率与洞察深度。用户可通过自然语言配置,快速完成高级数据分析与处理,无需额外部署调试。立即申请测试资格,体验智能化数据处理!
1629 4
火热邀测!DataWorks数据集成支持大模型AI处理
|
10月前
|
SQL 运维 自然语言处理
Dataphin智能化重磅升级!编码难题一扫光,开发运维更高效!
Dataphin重磅推出三大核心智能化能力:智能代码助手提升SQL开发效率;智能运维助手实现移动化任务管理;智能分析通过自然语言生成SQL,助力数据价值释放。未来将持续开放智能ETL、安全助手等能力,助力企业构建高效、稳定的数据资产体系。
740 0
|
人工智能 数据可视化
【MCP教程系列】上阿里云百炼,5分钟轻松实现查询、分析与可视化一站式解决方案
本文介绍如何在阿里云百炼平台上,通过4个简单步骤实现数据查询、分析与可视化的全流程解决方案。结合博查MCP服务和QuickChart功能,用户无需编程基础,仅需5分钟即可完成配置。
2109 0