创建dataworks空间的具体操作步骤是什么?
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。
创建DataWorks空间主要分为以下几个步骤:
进入阿里云DataWorks控制台,并登录账号。
选择要创建空间的地域。
DataWorks支持创建多个空间,每个空间独立运行。
点击"创建空间",进入新建页面。
输入空间名称和描述。
名称要有意义,最好代表该空间的用途。
设置VPC和子网。
DataWorks空间需要独立的VPC和子网,所以需要新建或选择已有的VPC和子网。
选择状态。
DataWorks支持创建生产和开发两个状态的空间。区别如下:
开发空间:便于开发测试使用,并发量和稳定性要求低一些。
生产空间:正式上线使用,性能和稳定性要求更高。
设置数据库访问规则。
DataWorks需要访问外部数据库,需要设置RAM角色或管理员访问权限。
确认设置信息,提交创建。
创建完成后,页面会自动跳转至该空间管理页。
可以继续创建资源组、项目、流程和报表等内容。
鼠标悬停至工作空间列表左上角的地域,单击需要创建工作空间的地域。单击创建工作空间,进行基本配置,单击下一步。分类 参数 描述
基本信息 工作空间名称 工作空间名称的长度需要在3~23个字符,以字母开头,且只能包含字母、下划线()和数字。
显示名 显示名不能超过23个字符,只能字母、中文开头,仅包含中文、字母、下划线()和数字。
模式 工作空间模式是DataWorks新版推出的新功能,分为简单模式和标准模式:
描述 对创建的工作空间进行简单描述。
高级设置 能下载select结果 控制数据开发中查询的数据结果是否能够下载,如果关闭无法下载select的数据查询结果。进入选择引擎界面,选择相应引擎后,单击下一步。DataWorks已正式商用,如果该地域没有开通,需要首先开通正式商用服务。选项 参数 描述
选择DataWorks服务 数据集成 数据集成是稳定高效、弹性伸缩的数据同步平台。致力于提供复杂网络环境下、丰富的异构数据源之间数据高速稳定的数据移动及同步能力。详情请参见数据集成模块。
数据开发 该页面是您根据业务需求,设计数据计算流程,并实现为多个相互依赖的任务,供调度系统自动执行的主要操作页面。详情请参见数据开发模块。
运维中心 该页面可对任务和实例进行展示和操作,您可以在此查看所有任务的实例。详情请参见运维中心模块。
数据质量 DataWorks数据质量依托DataWorks平台,为您提供全链路的数据质量方案,包括数据探查、数据对比、数据质量监控、SQLScan和智能报警等功能。详情请参见数据质量模块。
选择计算引擎服务 MaxCompute MaxCompute是一种快速、完全托管的TB或PB级数据仓库解决方案,能够更快速为您解决海量数据计算问题,有效降低企业成本,并保障数据安全。详情请参见MaxCompute。
实时计算 开通后,您可以在DataWorks中进行流式计算任务开发。详情请参见阿里云实时计算。
E-MapReduce 开通后,您可以在DataWorks中使用E-MapReduce,进行大数据处理任务的开发。详情请参见E-MapReduce。
交互式分析Hologres 开通后,您可以在DataWorks中使用Holostudio进行交互式分析的表管理、外部表管理和SQL任务的开发。详情请参见交互式分析。
Graph
https://help.aliyun.com/document_detail/74491.html,此回答整理自钉群“DataWorks交流群(答疑@机器人)”
DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。