活动实践 | DataWorks智能交互式数据开发与分析之旅

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
大数据开发治理平台DataWorks,资源组抵扣包 750CU*H
简介: 本指南介绍了如何使用阿里云平台进行大数据开发与分析。首先,在MaxCompute控制台创建项目并配置计算资源;接着,通过DataWorks控制台创建工作空间和独享资源组,并绑定工作空间。然后,创建个人开发环境,载入案例并新建Notebook实例。在Notebook中,通过SQL和Python Cell进行交互式开发和数据分析,体验智能助手Copilot的功能,如SQL改写、解释、生成注释及智能建表。最后,清理所有创建的资源,包括删除DataWorks资源、MaxCompute项目及网络配置,确保环境整洁。

1、进入MaxCompute控制台。

在左侧导航栏选择项目管理,地域选择为华东2(上海),单击新建项目。在新增项目对话框中输入项目名称,计算资源付费类型选择按量付费,默认Quta可根据自身情况选择(本场景使用的是开通MaxCompute时自动购买的os_默认后付费Quota_p),单击确定。

image.png

2、进入DataWorks产品控制台。

在左侧导航栏中,单击工作空间 > 创建工作空间
image.png

在左侧导航栏中,单击资源组 > 独享资源组 > 新建资源组。

image.png

image.png

在绑定工作空间页面,找到目标工作空间单击右侧的绑定。
image.png

3、创建个人开发环境

在左侧导航栏选择大数据体验 > DataWorks Gallery,单击DataWorks Notebook快速入门的载入案例。
image.png
在载入案例对话框中,选择刚刚创建的工作空间。在实例下拉框中,单击创建实例。

image.png

在新建实例页面,创建个人开发环境实例,设置实例名称,并选择刚刚创建的资源组,设定资源配额,最小2CU即可满足实验要求。
image.png

image.png

返回大数据体验 > DataWorks Gallery页面,在载入案例对话框中,选择刚刚创建的工作空间和实例,单击确认后进入个人开发空间。
image.png

新建Notebook。
image.png

image.png

4、以MaxCompute为例进行交互式开发

单击SQL,在弹出的SQL Cell中选择您想运行的大数据引擎,本场景以MaxCompute为例。
image.png
运行前需要选择计算资源,可单击SQL Cell右侧的请选择计算资源 > +绑定计算资源。
image.png

在绑定计算资源面板,单击绑定计算资源,选择MaxCompute。
image.png

image.png

创建成功后如下图所示。
image.png

返回Notebook文件编辑页,输入如下命令后,单击执行按钮。
image.png

5、使用Python进行数据分析

在Notebook中,能够新增Python Cell,编写Python代码进行数据处理和开发等。

单击+Python,唤出Python Cell。
image.png

在Python Cell中输入示例代码,单击执行按钮。
image.png

交互式分析。在Notebook中,您可以使用Python封装ipywidgets交互组件,并在SQL中引用该交互组件的变量,以实现灵活的交互式查询。

image.png

7、体验智能助手Copilot

SQL改写。在代码编辑器中,输⼊并选中下面的代码,单击顶部菜单栏右侧的Copilot,进⼊Copilot Chat功能界⾯,在Chat输⼊框中,输⼊您的改写要求,单击发送,等待Copilot返回结果。
image.png

SQL解释。在代码编辑器中,输⼊并选中下面的代码,单击顶部菜单栏右侧的Copilot,进⼊Copilot Chat功能界⾯,在Chat输⼊框中,输⼊您的改写要求,单击发送,等待Copilot返回结果。

image.png

生成注释。在代码编辑器中,输⼊并选中下面的代码,右击选择Copilot > 生成注释,进⼊Copilot Chat功能界⾯,在Chat输⼊框中,输⼊您的改写要求,单击image发送,等待Copilot返回结果。

image.png

智能建表。在Data Studio⻚⾯,单击左侧⼀级菜单栏中的数据⽬录,在数据⽬录列表中,选择任意⼀个数据⽬录,右键新建 > 新建表。进⼊新建表的功能界⾯,单击页面顶部中的Copilot建表,进⼊Copilot建表功能界⾯。在输⼊框中,输⼊您的指令如会员注册信息表,单击生成并替换,等待Copilot返回结果。
image.png
image.png

8、清理资源

删除Datawork资源组和工作空间。

image.png
image.png
image.png
image.png

删除MaxCompute项目。
image.png
image.png

删除VPC及交换机。
image.png
image.png

相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
相关文章
|
4月前
|
SQL DataWorks 大数据
DataWorks x 婚礼纪:智能一站式数据开发治理平台让千万新人的幸福时刻“数智化”
婚礼纪是杭州火烧云科技推出的结婚服务平台,覆盖婚宴酒店、婚纱摄影等全产业链,年服务超2000万对新人。为应对海量数据处理挑战,婚礼纪选择阿里云DataWorks作为一站式大数据开发治理平台,解决数据血缘不清、指标口径混乱等问题。通过湖仓一体架构与全链路数据治理,实现多源异构数据高效整合,支撑精准营销、交易风控等核心场景。DataWorks新版数据开发Data Studio大幅提升开发效率,Copilot智能助手优化SQL代码生成与测试,助力婚礼纪构建数据驱动的结婚产业服务中枢。
|
2月前
|
SQL DataWorks 关系型数据库
DataWorks+Hologres:打造企业级实时数仓与高效OLAP分析平台
本方案基于阿里云DataWorks与实时数仓Hologres,实现数据库RDS数据实时同步至Hologres,并通过Hologres高性能OLAP分析能力,完成一站式实时数据分析。DataWorks提供全链路数据集成与治理,Hologres支持实时写入与极速查询,二者深度融合构建离在线一体化数仓,助力企业加速数字化升级。
|
5月前
|
人工智能 自然语言处理 DataWorks
DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型,数据开发与分析效率再升级!
阿里云DataWorks平台正式接入Qwen3模型,支持最大235B参数量。用户可通过DataWorks Copilot智能助手调用该模型,以自然语言交互实现代码生成、优化、解释及纠错等功能,大幅提升数据开发与分析效率。Qwen3作为最新一代大语言模型,具备混合专家(MoE)和稠密(Dense)架构,适应多种应用场景,并支持MCP协议优化复杂任务处理。目前,用户可通过DataWorks Data Studio新版本体验此功能。
477 23
DataWorks Copilot 集成Qwen3-235B-A22B混合推理模型,数据开发与分析效率再升级!
|
5月前
|
人工智能 自然语言处理 DataWorks
Qwen3 X DataWorks :为数据开发与分析加满Buff !
阿里云DataWorks平台正式接入Qwen3模型,支持最大235B参数量。用户可通过DataWorks Copilot智能助手调用该模型,以自然语言交互实现代码生成、优化、解释及纠错等功能,大幅提升数据开发与分析效率。Qwen3作为最新一代大语言模型,具备混合专家(MoE)和稠密(Dense)架构,适应多种应用场景,并支持MCP协议优化复杂任务处理。目前,用户可通过DataWorks Data Studio新版本体验此功能。
261 27
|
6月前
|
自然语言处理 DataWorks 数据挖掘
使用DataWorks Notebook实现智能图片标注,给你的图片加个“注释”
本文介绍如何使用DataWorks Notebook结合视觉识别模型RAM和自然语言处理模型BERT实现多模态图片标注,为智能内容生成和多模态数据分析的广泛应用提供支持。
|
6月前
|
SQL 弹性计算 DataWorks
Flink CDC 在阿里云 DataWorks 数据集成入湖场景的应用实践
Flink CDC 在阿里云 DataWorks 数据集成入湖场景的应用实践
271 6
|
7月前
|
人工智能 自然语言处理 DataWorks
DataWorks X DeepSeek : 用AI实现数据开发治理!
阿里云DataWorks正式接入DeepSeek-R1系列模型,用户可通过DataWorks Copilot智能助手,以自然语言交互完成代码操作,实现数据开发、分析与治理全流程。DataWorks内置阿里巴巴16年大数据建设方法论,支持多种大数据引擎和AI计算服务,助力“Data+AI”全生命周期管理。开通DataWorks后即可免费体验DataWorks Copilot。
|
8月前
|
DataWorks 监控 数据建模
DataWorks产品体验评测
DataWorks产品体验评测
|
8月前
|
分布式计算 DataWorks 搜索推荐
DataWorks 产品评测与最佳实践探索!
DataWorks 是阿里巴巴推出的一站式智能大数据开发治理平台,内置15年实践经验,集成多种大数据与AI服务。本文通过实际使用角度,探讨其优势、潜力及改进建议。评测涵盖用户画像分析、数据治理、功能表现等方面,适合数字化转型企业参考。
179 1

热门文章

最新文章