DataWorks百问百答37:DataWorks-MaxCompute权限体系有哪些混淆点?

本文涉及的产品
大数据开发治理平台DataWorks,Serverless资源组抵扣包300CU*H
简介: DataWorks-MaxCompute权限体系混淆点分析

背景

     
DataWorks是大数据引擎上层的一个数据开发、生产、治理平台,有自己一套完善的权限体系,但由于下层对接的引擎较多(MaxCompute、EMR、Blink等),因此用户常常对DataWorks权限、引擎权限产生混淆。

常见问题集锦

  • DataWorks开发角色好像可以读写所有表,这岂不是很危险?
  • [工作空间管理-权限列表]中的权限和引擎权限有什么关系?里面的表权限是针对所有引擎的吗?
  • [工作空间管理-成员管理]与[工作空间管理-MaxCompute高级配置-自定义角色]中的角色到底有什么区别?
  • ………………

说明

权限类型区分

DataWorks自身有一套权限体系,即[工作空间管理-权限列表]中所描述的内容。
image.png
这套权限体系和引擎的权限体系有什么区别?
很简单:[工作空间管理-权限列表]描述的是DataWorks本身功能的功能,如:XX用户(角色)可以创建数据源、新建节点、提交/编辑/发布节点、运维中心冻结/暂停/重跑等功能;而引擎权限描述的权限点则是对引擎的操作,如:XX用户(角色)可以读写某表(table_1)、设置引擎支持的数据类型、是否允许全表扫描等(可参考MaxCompute用户与权限管理)。

DataWorks权限与引擎权限的联系

【常见问题一】
  既然DataWorks权限、引擎权限是有区别的,那为什么我将RAM子账号加入到[工作空间管理-成员管理-开发角色]中,就能访问MaxCompute的表了?
  有如下几点特性来进行说明:
(1)DataWorks、MaxCompute内的权限主体(执行任务的身份)都是阿里云主/子账号。
(2)DataWorks本身的角色与MaxCompute之间的角色存在联动关系。
       当一个阿里云RAM子账号被加入至DataWorks空间时,就会自动被加入至MaxCompute项目中。
       例如:将某个RAM子账号(RAM_A)加入至DataWorks开发角色,则该子账号会被同时加入至该空间所绑定得到MaxCompute项目role_project_dev、role_project_scheduler两个Role中(这两个Role有在MaxCompute项目内启动任务、读写数据的权限),因此RAM_A即能进入DataWorks创建节点,也能通过节点运行代码读写MaxCompute上的表。
image.png
image.png
【常见问题二】
  在开发环境、生产环境究竟运行任务的是谁?需要如何保证权限足够且合理?
(1)标准模式(一个DataWorks空间对应两个MaxCompute项目)
    ①开发环境:执行任务的身份为“任务执行者”,即:谁运行任务,身份就是谁。
     在DataStudio、开发环境运维中心执行的任务将会下发到MaxCompute开发环境项目,同时,能够在开发环境运行任务的账号,也被自动加入了对应的MaxCompute Role,拥有了引擎相关权限,因此不必担心任务运行失败。
image.png
    ②生产环境:执行任务的身份可选择为主账号或固定的子账号;要注意,生产环境的MaxCompute项目除了主账号,没有自动加入过任何RAM子账号,因此如选择了子账号,页面会进行提醒并执行授权:
image.png
(2)简单模式(一个DataWorks空间对应一个MaxCompute项目)
    与标准模式不同,简单模式提交即调度(无需发布)。
    目前提供了两种访问身份模式:阿里云主账号、任务责任人(谁创建任务谁就为执行者);如选择了任务责任人,则要保证对应任务的责任人角色权限足够,并避免子账号被删除、禁用等情况。
image.png
应尽量避免:
①子账号角色变更为无权执行任务的角色,如:“访客”、“运维”、“部署”“安全管理员”(这些角色在MaxCompute内对应的Role没有执行任务、读写数据的权限)。此时执行任务将提醒权限不够:
image.png
    ②子账号被从DataWorks空间内移除,则会报错用户不存在与项目内:
image.png

DataWorks百问百答历史记录 请点击这里查看>>

更多DataWorks技术和产品信息,欢迎加入【DataWorks钉钉交流群】

相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
一站式大数据开发治理平台DataWorks初级课程
DataWorks 从 2009 年开始,十ー年里一直支持阿里巴巴集团内部数据中台的建设,2019 年双 11 稳定支撑每日千万级的任务调度。每天阿里巴巴内部有数万名数据和算法工程师正在使用DataWorks,承了阿里巴巴 99%的据业务构建。本课程主要介绍了阿里巴巴大数据技术发展历程与 DataWorks 几大模块的基本能力。 课程目标  通过讲师的详细讲解与实际演示,学员可以一边学习一边进行实际操作,可以深入了解DataWorks各大模块的使用方式和具体功能,让学员对DataWorks数据集成、开发、分析、运维、安全、治理等方面有深刻的了解,加深对阿里云大数据产品体系的理解与认识。 适合人群  企业数据仓库开发人员  大数据平台开发人员  数据分析师  大数据运维人员  对于大数据平台、数据中台产品感兴趣的开发者
相关文章
|
4月前
|
SQL 分布式计算 DataWorks
DataWorks产品使用合集之如何开发ODPS Spark任务
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
6天前
|
SQL DataWorks 数据可视化
阿里云DataWorks评测:大数据开发治理平台的卓越表现
阿里云DataWorks是一款集数据集成、开发、分析与管理于一体的大数据平台,支持多种数据源无缝整合,提供可视化ETL工具和灵活的任务调度机制。其内置的安全体系和丰富的插件生态,确保了数据处理的高效性和安全性。通过实际测试,DataWorks展现了强大的计算能力和稳定性,适用于中小企业快速搭建稳定高效的BI系统。未来,DataWorks将继续优化功能,降低使用门槛,并推出更多灵活的定价方案,助力企业实现数据价值最大化。
|
10天前
|
SQL 分布式计算 DataWorks
DataWorks产品测评|基于DataWorks和MaxCompute产品组合实现用户画像分析
本文介绍了如何使用DataWorks和MaxCompute产品组合实现用户画像分析。首先,通过阿里云官网开通DataWorks服务并创建资源组,接着创建MaxCompute项目和数据源。随后,利用DataWorks的数据集成和数据开发模块,将业务数据同步至MaxCompute,并通过ODPS SQL完成用户画像的数据加工,最终将结果写入`ads_user_info_1d`表。文章详细记录了每一步的操作过程,包括任务开发、运行、运维操作和资源释放,帮助读者顺利完成用户画像分析。此外,还指出了文档中的一些不一致之处,并提供了相应的解决方法。
|
9天前
|
分布式计算 DataWorks 搜索推荐
聊聊DataWorks这个大数据开发治理平台
聊聊DataWorks这个大数据开发治理平台
39 2
|
12天前
|
机器学习/深度学习 存储 数据采集
解锁DataWorks:一站式大数据治理神器
解锁DataWorks:一站式大数据治理神器
34 1
|
4月前
|
DataWorks Kubernetes 大数据
飞天大数据平台产品问题之DataWorks提供的商业化服务如何解决
飞天大数据平台产品问题之DataWorks提供的商业化服务如何解决
|
23天前
|
DataWorks 搜索推荐 大数据
聊聊DataWorks——这个一站式智能大数据开发治理平台
聊聊DataWorks——这个一站式智能大数据开发治理平台
50 2
|
6天前
|
分布式计算 DataWorks 搜索推荐
DataWorks产品评测:大数据开发治理平台的最佳实践与体验
DataWorks是阿里云推出的一款大数据开发治理平台,集成了多种大数据引擎,支持数据集成、开发、分析和任务调度。本文通过用户画像分析的最佳实践,评测了DataWorks的功能和使用体验,并提出了优化建议。通过实践,DataWorks在数据整合、清洗及可视化方面表现出色,适合企业高效管理和分析数据。
50 0
|
4月前
|
SQL 分布式计算 DataWorks
DataWorks产品使用合集之未保存的ODPS SQL语句该如何找回
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
|
4月前
|
分布式计算 DataWorks 关系型数据库
DataWorks产品使用合集之ODPS数据怎么Merge到MySQL数据库
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。

热门文章

最新文章

相关产品

  • 大数据开发治理平台 DataWorks