智能体Agent解析:用自然语言重构数据开发工作方式

本文涉及的产品
大数据开发治理平台DataWorks,资源组抵扣包 750CU*H
简介: 大数据开发治理平台DataWorks基于MCP协议,正式发布了DataWorks Agent,内置DataWorks MCP Server V1.0。该功能支持在DataWorks Data Studio中通过自然语言交互完成数据开发任务,实现了需求即代码的开发体验。本文将详细介绍如何通过配置使用DataWorks MCP Server进行任务的开发和运维管理。

引言:本文分享如何基于利用MCP协议,配置MCP Server,以调用大数据开发与治理平台DataWorks Open API搭建智能体Agent,实现通过自然语言完成数据集成与数据开发等任务。文章还介绍了MCP协议的基本知识,帮助大家了解背后实现原理。大家可以通过自行配置体验数据工作流智能自动化运行。


前言

您是否常常为数据集成的繁琐配置而烦恼?是否因为手撕SQL语句为数据开发而头疼呢?传统的数据开发工作就像在迷宫中穿行,据统计,开发者平均每天执行137次点击操作,60%时间消耗在功能检索而非核心逻辑,效率十分低下。试想:如果能够有一个平台,通过自然语言输入就能智能化自动运行数据集成和数据开发任务就好了。现在,阿里云大数据开发治理平台DataWorks的智能体Agent(基于MCP协议)即可实现这个想法,下面让我们来了解下具体实现方式吧!


什么是MCP?

Model Context Protocol(MCP)是人工智能领域提出的一种标准化协议框架,其全称“Model Context Protocol”直译为“模型上下文协议”。该协议的核心目标是为大模型(如超大规模语言模型、多模态模型等)提供统一的上下文接口标准,使其能够无缝连接外部数据源、工具和服务。通过标准化的数据交互规范和功能调用机制,MCP打破了传统AI系统中模型与外部资源之间的“孤岛效应”,使模型能够像调用自身内置功能一样灵活地利用外部资源。

该协议通过定义四⼤核⼼原语实现交互标准化:

1. 资源(Resources):结构化数据⽚段,如实时⾏情数据、历史报表等,为大模型提供决策依据;

2. ⼯具(Tools):封装的可执⾏函数,⽀持 SQL 查询、可视化渲染等专业操作;

3. 提示(Prompts):预定义的任务指令模板,引导 LLM ⽣成符合业务规范的输出;

4. 采样(Sampling):异步调⽤机制,允许服务器向 LLM 请求多轮推理结果。

其设计理念可类比软件开发从汇编语言到高级语言的演进,通过协议抽象降低AI应用开发门槛。


DataWorks MCP Server基本介绍

基本架构

DataWorks新版数据开发的个人开发环境,在阿里云原生的能力上搭建了用户专属的开发环境,环境中内置了VSCode客户端,登录DataWorks后可通过浏览器访问,您可以选择安装MCP Client插件(如Cline),通过配置DataWorks开源的MCP Server,输入指令即可完成DataWorks的数据开发运维等动作。


基本概念


如上图所示,个人开发环境本质上是用户在DataWorks上创建出来的一台服务器,除了DataWorks的开发运维,还能安装开源生态的各种插件,比如:

  • 通过filesystem实现对文件的读写操作。
  • 通过git实现对Git工作空间的git操作。

不局限于此,您可以添加各种开源的mcp servers到个人开发环境。


DataWorks Agent是什么?

阿里云大数据开发治理平台DataWorks基于MCP协议搭建的DataWorks Agent,内置 DataWorks MCP Server V1.0,支持在DataWorks Data Studio中通过自然语言交互来自动化操作DataWorks上的产品功能,完成数据集成、数据开发等一些复杂的操作,使得Data Studio平台实现了从"工具操作"向"语义理解"的演进。


DataWorks  Agent ,现已支持将 DataWorks 数据集成、数据开发、任务运维相关的OpenAPI作为Tools的DataWorks MCP Server,可为开发者提供智能Agent服务,开发者无需再到平台UI中到处查找功能界面,给出自然语言指令即完成相关工作,“所言即所得”,大大提升了工作效率和体验。


DataWorks Agent  核心功能

DataWorks  Agent当前支持通过自然语言指令自动化创建和启动实时/离线数据同步任务,一键查看同步任务配置信息和执行概况;支持快速批量创建和修改数据开发节点,避免了用户繁琐重复的机械性操作;支持运行任务的智能分析,针对需要重跑的任务自动化执行重跑操作,有效提升任务运维的效率。


现在,DataWorks Agent正全面推进面向数据开发、数据治理、任务运维等场景应用能力的上线,未来,DataWorks将具备开发者通过使用自然语言即可完成数据开发与治理全链路的能力,真正进入数据开发与治理的新纪元。


如何配置DataWorks MCP Server

1. 没有个人开发环境


2. 已有个人开发环境升级

  • 打开terminal,执行以下脚本:
wget https://nodejs.org/dist/v20.19.0/node-v20.19.0-linux-x64.tar.xz
tar xf node-v20.19.0-linux-x64.tar.xz
mv /etc/dsw/node /etc/dsw/node14
mv node-v20.19.0-linux-x64 /etc/dsw/node
bash <(curl -s https://dataworks-notebook-${REGION}.oss-${REGION}.aliyuncs.com/public-datasets/aone-release/dwcode-server/scripts/update.sh)  0.2.169


  • 刷新页面后,从VSCode的应用市场搜索Cline进行安装



3. 配置LLM APIKey,支持您配置使用不同的LLM模型(此处以阿里云百炼的API为例)


  • 完成模型配置。


4. 安装MCP Server

  • 通过界面打开DataWorks MCP Server的配置界面-Configure MCP Servers。


  • 在配置界面填入如下配置,注意修改其中的REGION信息:
{
  "mcpServers": {
    "alibabacloud-dataworks-mcp-server": {
      "command": "npx",
      "args": [
        "alibabacloud-dataworks-mcp-server"
      ],
      "env": {
        "REGION": "cn-beijing",
        "ALIBABA_CLOUD_CREDENTIALS_URI": "http://localhost:7002/api/v1/credentials/0",
        "TOOL_CATEGORIES": "SERVER_IDE_DEFAULT"
      },
      "disabled": false,
      "autoApprove": [],
      "timeout": 60
    }
  }
}


  • 看到如下加载成功的Tools可确认alibabacloud-dataworks-mcp-server已安装成功:


  • 在任务界面,您可以输入“我有哪些工作空间?”开始测试


进阶玩法:安装其他MCP Servers进行探索

您可以参考mcp-servers安装其他的MCP Servers到个人开发环境。参考地址:https://github.com/modelcontextprotocol/servers/


立即体验

目前,DataWorks Agent支持安装并启用应用市场的多种MCP Server!

参与DataWorks Data Studio新版公测即可使用DataWorks Agent,欢迎使用DataWorks产品进行体验!

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
一站式大数据开发治理平台DataWorks初级课程
DataWorks 从 2009 年开始,十ー年里一直支持阿里巴巴集团内部数据中台的建设,2019 年双 11 稳定支撑每日千万级的任务调度。每天阿里巴巴内部有数万名数据和算法工程师正在使用DataWorks,承了阿里巴巴 99%的据业务构建。本课程主要介绍了阿里巴巴大数据技术发展历程与 DataWorks 几大模块的基本能力。 产品官网 https://www.aliyun.com/product/bigdata/ide 大数据&amp;AI体验馆 https://workbench.data.aliyun.com/experience.htm#/ 帮助文档https://help.aliyun.com/zh/dataworks 课程目标 &nbsp;通过讲师的详细讲解与实际演示,学员可以一边学习一边进行实际操作,可以深入了解DataWorks各大模块的使用方式和具体功能,让学员对DataWorks数据集成、开发、分析、运维、安全、治理等方面有深刻的了解,加深对阿里云大数据产品体系的理解与认识。 适合人群 &nbsp;企业数据仓库开发人员 &nbsp;大数据平台开发人员 &nbsp;数据分析师 &nbsp;大数据运维人员 &nbsp;对于大数据平台、数据中台产品感兴趣的开发者
相关文章
|
10月前
|
存储 API
LangChain与智能Agent构建问题之MetaGPT中工程师智能体代码错误如何解决
LangChain与智能Agent构建问题之MetaGPT中工程师智能体代码错误如何解决
115 1
|
9天前
|
机器学习/深度学习 设计模式 人工智能
深度解析Agent实现,定制自己的Manus
文章结合了理论分析与实践案例,旨在帮助读者系统地认识AI Agent的核心要素、设计模式以及未来发展方向。
419 94
深度解析Agent实现,定制自己的Manus
|
1月前
|
人工智能 自然语言处理 运维
智能体Agent:用自然语言重构数据开发
本文分享如何基于利用MCP协议,配置MCP Server,以调用大数据开发与治理平台DataWorks Open API搭建智能体Agent,实现通过自然语言完成数据集成与数据开发等任务。文章还介绍了MCP协议的基本知识,帮助大家了解背后实现原理。大家可以通过自行配置体验数据工作流智能自动化运行。
295 47
智能体Agent:用自然语言重构数据开发
|
2月前
|
存储 人工智能 JSON
Evolving Agents:开源Agent革命!智能体动态进化框架上线,复杂任务一键协同搞定
Evolving Agents 是一个开源的AI Agent管理与进化框架,支持智能代理之间的通信与协作,能够根据语义理解需求动态进化,适用于文档处理、医疗保健、金融分析等多个领域。
165 25
Evolving Agents:开源Agent革命!智能体动态进化框架上线,复杂任务一键协同搞定
|
2月前
|
存储 人工智能 人机交互
Multi-Agent Orchestrator:亚马逊开源AI智能体自动协作黑科技!重构人机交互逻辑,1秒精准分配任务
Multi-Agent Orchestrator 是亚马逊开源的多智能体框架,能够动态分配代理、维护上下文、支持多种代理类型,适用于客户服务、智能交通、物流配送等复杂场景。
107 9
Multi-Agent Orchestrator:亚马逊开源AI智能体自动协作黑科技!重构人机交互逻辑,1秒精准分配任务
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
Agent Laboratory 是由 AMD 和约翰·霍普金斯大学联合推出的自主科研框架,基于大型语言模型,能够加速科学发现、降低成本并提高研究质量。
450 23
Agent Laboratory:AI自动撰写论文,AMD开源自动完成科研全流程的多智能体框架
|
5月前
|
存储 人工智能 人机交互
PC Agent:开源 AI 电脑智能体,自动收集人机交互数据,模拟认知过程实现办公自动化
PC Agent 是上海交通大学与 GAIR 实验室联合推出的智能 AI 系统,能够模拟人类认知过程,自动化执行复杂的数字任务,如组织研究材料、起草报告等,展现了卓越的数据效率和实际应用潜力。
471 1
PC Agent:开源 AI 电脑智能体,自动收集人机交互数据,模拟认知过程实现办公自动化
|
5月前
|
人工智能 自然语言处理 前端开发
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
Director 是一个构建视频智能体的 AI 框架,用户可以通过自然语言命令执行复杂的视频任务,如搜索、编辑、合成和生成视频内容。该框架基于 VideoDB 的“视频即数据”基础设施,集成了多个预构建的视频代理和 AI API,支持高度定制化,适用于开发者和创作者。
208 9
Director:构建视频智能体的 AI 框架,用自然语言执行搜索、编辑、合成和生成等复杂视频任务
|
6月前
|
传感器 机器学习/深度学习 自然语言处理
智能代理(Agent)在工具调用与协作中的应用实践
随着人工智能技术的飞速发展,智能代理(Agent)技术已成为解决复杂任务的关键手段。本文深入探讨了如何设计灵活的工具调用机制和构建高效的单/多Agent系统以提升任务执行效率。文章不仅涵盖了相关的理论知识,还提供了丰富的实践案例和代码实现,旨在帮助读者深入理解和应用智能代理技术。
615 2
|
7月前
|
人工智能 JSON 自然语言处理
开源模型+Orchestrating Agents多智能体框架,易用、强大且可控
本文采用开源Qwen2.5-14B-instruct-GGUF来体验多智能体编排和交接,希望在体验多智能体编排和交接框架的同时,一起评估中小参数规模的模型(14B)能否较好的完成多智能体任务。