【全新系列】DataWorks百问百答
DataWorks作为飞天大数据平台操作系统,对接各种大数据计算引擎,以all in one box的方式提供专业高效、安全可靠的全域智能大数据平台,高效率完成数据全链路研发流程,建设企业数据治理体系。 从2009年飞天大数据平台写下第一行代码开始,DataWorks历经10年发展,形成一套成熟的产品功能体系,满足企业数据中台搭建需求。
通过本系列,您可以了解各种DataWorks产品使用的最佳...
查看全文 >>
DataWorks 2020-08 产品月刊
本月DataWorks产品月刊为您带来
产品活动:
1.首月特惠!DataWorks专业版原价5000元现仅需199元;独享数据集成/调度资源组首月5折
重要发布:
1.实时同步功能上线2.DataWorks Open API开始公测
产品功能更新:
1.迁移助手支持Oozie和azkaban的任务上云2.EMR on DataWorks支持安全模式3.DataWorks独享资源组支持资源水...
查看全文 >>
DataWorks百问百答37:DataWorks-MaxCompute权限体系有哪些混淆点?
背景
DataWorks是大数据引擎上层的一个数据开发、生产、治理平台,有自己一套完善的权限体系,但由于下层对接的引擎较多(MaxCompute、EMR、Blink等),因此用户常常对DataWorks权限、引擎权限产生混淆。
常见问题集锦
DataWorks开发角色好像可以读写所有表,这岂不是很危险?
[工作空间管理-权限列表]中的权限和引擎权限有什么关系?里面的表权限是针对所有...
查看全文 >>
在MaxCompute中配置Policy策略遇到结果不一致的问题
通过policy配置权限过程中遇到的一些问题
背景信息:
本文以如下场景为基准进行编写,如下:
用户通过DataWorks-简单模式使用MaxCompute;
用户具有DataWorks默认角色,如DataWorks开发者角色;
用户通过console提交policy配置精细化权限管控,
本案例以禁止某一些用户群体(role)可以删除以tb_开头的表为例来展开讨论。
解决方案:
通过po...
查看全文 >>
IBM数据集成分析平台—DataWorks真面目
文章讲的是IBM数据集成分析平台—DataWorks真面目,大数据在许多方面仍然属于野蛮生长状态,很多数据集成专家发现,加载数据和从来源迁移到目标通常是耗时而又单调的任务,要想从各种字节中找出有价值的洞见,依然需要敏捷的智慧与坚持不懈的精神。本周二,IBM发布了新版数据平台DataWorks,据称比其他数据平台摄取数据速度更快。
目前,可以在IBM的Bluemix云平台下载DataWork...
查看全文 >>
Data Lake Analytics: 使用DataWorks来调度DLA任务
DataWorks作为阿里云上广受欢迎的大数据开发调度服务,最近加入了对于Data Lake Analytics的支持,意味着所有Data Lake Analytics的客户可以获得任务开发、任务依赖关系管理、任务调度、任务运维等等全方位强大的能力,今天就给大家介绍一下如何使用DataWorks来调度DLA的脚本任务。
开通DLA
在开始之前我们要有一个 DLA 的账号,目前 DLA 的新用户都...
查看全文 >>
转载《Data Lake Analytics: 使用DataWorks来调度任务》
DataWorks作为阿里云上广受欢迎的大数据开发调度服务,最近加入了对于Data Lake Analytics的支持,意味着所有Data Lake Analytics的客户可以获得任务开发、任务依赖关系管理、任务调度、任务运维等等全方位强大的能力,今天就给大家介绍一下如何使用DataWorks来调度DLA的脚本任务。
开通DLA
在开始之前我们要有一个 DLA 的账号,目前 DLA 的新用户都...
查看全文 >>
DataWorks百问百答01:数据同步该用什么资源组?
引子
很多用户在使用数据集成建立同步任务时,往往都会困惑一个设置,即“资源组设置”。大家常有的疑问是“资源组是用来做什么的?跟网络之间什么关系?我该选择那种资源组?”下面本文给您一个简要的介绍。
什么是资源组
资源组是数据集成用来运行数据同步任务的计算资源,可以通俗的理解为“带有CPU、内存和网络的计算机或计算机集群”。同步任务就是运行在上面的“程序”。所以如果机器性能低或者运行的程序过多,...
查看全文 >>
DataWorks百问百答01:数据同步该用什么资源组?
引子
很多用户在使用数据集成建立同步任务时,往往都会困惑一个设置,即“资源组设置”。大家常有的疑问是“资源组是用来做什么的?跟网络之间什么关系?我该选择那种资源组?”下面本文给您一个简要的介绍。
什么是资源组
资源组是数据集成用来运行数据同步任务的计算资源,可以通俗的理解为“带有CPU、内存和网络的计算机或计算机集群”。同步任务就是运行在上面的“程序”。所以如果机器性能低或者运行的程序过多,...
查看全文 >>
使用 Dataworks 实现 AnalyticDB PostgreSQL版上的 ETL 作业调度
DataWorks作为阿里云上广受欢迎的大数据开发调度服务,最近加入了对于AnalyticDB PostgreSQL版(原HybridDB for PostgreSQL,简称ADB PG版)的支持,意味着所有ADB PG版的客户可以获得任务开发、任务依赖关系管理、任务调度、任务运维等等全方位强大的能力,进一步增强ADB PG版的ETL能力,今天就给大家介绍一下如何使用DataWorks来调度AD...
查看全文 >>