大数据开发治理平台 DataWorks

首页 标签 大数据开发治理平台 DataWorks
MaxCompute/DataWorks账号权限及依赖整理-持续更新
经常有人问在MaxCompute和Dataworks中,主子账号的权限分别对应哪些操作,是否可以用子账号创建Project?是否用子账号购买资源?子账号是否可以做数据同步? 今天抽时间整理了一些用户经常遇到的MaxCompute/DataWorks权限问题,后续还会逐步更新。
基于MaxCompute的数仓数据质量管理
数据对一个企业来说已经是一项重要的资产,既然是资产,肯定需要管理。随着业务的增加,数据的应用越来越多,企业在创建的数仓过程中对数据的管理也提出了更高的要求,而数据质量也是数仓建设过程不容忽视的环节。本文针对MaxCompute数仓建设过程中如何做数据质量给出规范建议,为实际数据治理提供依据及指导。
MaxCompute安全管理指南-案例篇
通过《MaxCompute安全管理-基础篇》了解到MaxCompute和DataWorks的相关安全模型、两个产品安全方面的关联,以及各种安全操作后,本篇主要给出一些安全管理案例,给安全管理的成员作为参考。
【阿里云新品发布·周刊】第10期:阿里云DCDN自主研发的IP应用加速,为加速而生!
2019年5月22日15时,阿里云DCDN - IP应用加速是阿里云自主研发的一款更高效、更安全、更便捷的动态加速产品,结合阿里云CDN本身的资源优势,利用就近接入、智能路由,传输协议优化以及多种负载均衡技术,实现更高可靠的全站加速解决方案。
DataWorks使用之批量删除数据表
MaxCompute平台上存储着海量的数据,对应着数以百计、千计的数据表,如何高效、快捷的管理这些表,成为了管理员的重要任务。比如要在这茫茫多的数据表中,删除表名包含字符串“temp_”的临时数据表,管理员这时该如何操作,才能快速的找到这些数据表,并删除它们呢?首先用户登录管理控制台,进入DataWorks的工作台页面,然后单击顶部菜单项【数据管理】。
MaxCompute 数据计算入门
阿里云的MaxCompute是大数据存储和分析平台。使用DataHub、SLS可以将海量数据轻松同步到MaxCompute,然后使用SQL查询、UDF和Map Reduce进行数据处理、分析和挖掘等任务。
MaxCompute Mars 完全指南
Mars 能利用并行和分布式技术,加速 Python 数据科学栈,包括 numpy、pandas 和 scikit-learn。同时,也能轻松与 TensorFlow、PyTorch 和 XGBoost 集成。
基于MaxCompute/Dataworks实现数据仓库管理与全链路数据体系
前言   就这样,大数据领域蓬勃发展了好几年,有很多伙伴执迷于技术,成为了分布式计算与存储的领域专家。也有很多伙伴执迷于数据,成为了行业的数据研发专家。当然还有很多小伙伴,热衷于工具系统开发,成为了数据技术专家。
免费试用