开发者社区> 大数据与机器学习> 大数据开发治理DataWorks

大数据开发治理DataWorks

关注

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

0
今日
18292
内容
9
活动
3188
关注
|
SQL 数据采集 存储
|

DataWorks 2021-09 产品月刊

本月DataWorks产品月刊为您带来:1、数据治理中心全新发布。2、数据服务API资产全面纳入数据地图管理范畴。3、DataStudio支持用户通过扩展程序对页面功能进行卡点

1089 0
|
SQL 运维 分布式计算
|

DataWorks功能实践速览 05——循环与遍历

DataWorks功能实践系列,帮助您解析业务实现过程中的痛点,提高业务功能使用效率!通过往期的介绍,您已经了解到在DataWorks上进行任务运行的最关键的几个知识点,其中上期参数透传中为您介绍了可以将上游节点参数透传到下游节点的特殊节点——赋值节点,结合赋值节点和其他节点,可实现循环或遍历读取处理数据的任务。本期为您介绍如何在DataWorks上实现循环与遍历任务。

1784 0
|
SQL 消息中间件 运维
|

DataWorks 2021-08 产品月刊(含用户体验季刊!)

全新上线DataWorks用户体验季刊! 过去几个月我们通过问卷了解到大家对DataWorks体验的满意情况,收集了一些问题。因此,DataWorks产品研发团队针对用户体验问题做了产品优化,并以页面形式向您集中展现!您的声音我们始终关心!(季刊页面拉倒底部有反馈入口,欢迎大家踊跃和我们沟通!)

1082 0
|
SQL 分布式计算 DataWorks
|

DataWorks功能实践速览 04 — 参数透传

DataWorks功能实践系列,帮助您解析业务实现过程中的痛点,提高业务功能使用效率!

1709 0
|
数据采集 存储 分布式计算
|

DataWorks数据集成离线增量同步配置讲解

本篇为熟能生巧系列19期的离线增量同步讲解部分,鉴于用户咨询需求,单独成一篇,方便大家阅览

4601 0
|
分布式计算 DataWorks 安全
|

DataWorks 功能实践速览03期 — 生产开发环境隔离

DataWorks功能实践系列,帮助您解析业务实现过程中的痛点,提高业务功能使用效率!

1408 0
|
SQL JSON 分布式计算
|

DataWorks熟能生巧系列直播第六期:数据集成日志详解

数据集成的任务日志主要分为两个部分,第一部分主要打印任务的整体状态,第二部分打印线程明细、各子线程执行过程以及执行结果。这两部分日志是分开的,但有一个共同的调度信息模块,记录运行机器、地域信息、项目名、节点信息、参数值等。此外,数据集成资源组有3种标识,我们通过标识能轻松识别数据集成跑在哪个资源组上。

810 0
|
分布式计算 DataWorks 关系型数据库
|

DataWorks熟能生巧系列直播第五期:数据集成批量生成同步任务

本文介绍了数据集成的整库迁移,批量上云和分库分表的操作,并进行了实操演示,对各种规则进行了解释,提出了需要注意的问题和解决方案。

727 0
|
分布式计算 DataWorks 数据库
|

DataWorks 功能实践速览02期

DataWorks功能实践系列,帮助您解析业务实现过程中的痛点,提高业务功能使用效率!

1396 0
|
数据采集 DataWorks 负载均衡
|

DataWorks 2021-07 产品月刊

本月DataWorks产品月刊为您带来 产品活动: 1.首月特惠!DataWorks专业版首月仅需199元,省4801元;独享数据集成/调度资源组首月5折 2.「数据地图」开放用户体验问卷啦,快来参与吧 产品功能更新: DataWorks数据治理模块新增审批中心,可自定义审批流程 独享数据服务资源组上线杭州region DataWorks迁移助手8.1日正式商业化 DataWorks支持DLF元数据采集 DataWorks支持任务下发EMR gateway节点

891 0
|
资源调度 DataWorks 关系型数据库
|

DataWorks熟能生巧系列直播第四期:DataWorks数据集成独享资源组与VPC数据源网络打通

本文主要介绍了DataWorks相关资源组的概念,包括分类、区别和使用场景等,并实操演示了如何打通数据集成独享资源组与VPC数据源网络

653 0
|
分布式计算 DataWorks 关系型数据库
|

DataWorks 功能实践速览01期

DataWorks功能实践系列,解析业务实现过程中的痛点,提高业务功能使用效率! 功能推荐:解决业务痛点!

1165 0
|
数据采集 人工智能 运维
|

《一站式大数据开发治理DataWorks使用宝典》官方电子书开放下载

零基础入门大数据开发治理,上手DataWorks 10大模块

39708 2
|
存储 数据采集 分布式计算
|

DataWorks数据治理介绍及实践 | 《一站式大数据开发治理DataWorks使用宝典》

当我们在谈论数据治理时,经常会跟数据管理这一概念一起讨论。DataWorks设计数据治理产品功能时,参考的主要也是数据管理领域内的三大理论依据:第一个是数据管理协会知识体系,也就是大家熟知的DAMA、DMBOK2;第二个是DCMM数据管理能力成熟度评估;第三个是信通院的数据资产管理实践白皮书。

3556 0
|
SQL 分布式计算 运维
|

DataWorks迁移助手介绍及最佳实践 | 《一站式大数据开发治理DataWorks使用宝典》

迁移助手是DataWorks上开发成果快速复制的利器,通过迁移助手可以将DataWorks上的开发成果在不同的环境快速复制。迁移助手是DataWorks的一个全新模块,它的核心能力主要分为两部分,一是任务上云,二是DataWorks迁移。

2184 0
|
SQL 运维 DataWorks
|

DataWorks数据服务介绍及最佳实践 | 《一站式大数据开发治理DataWorks使用宝典》

DataWorks作为一站式大数据开发治理平台,构建了从数据集成、数据开发、数据服务到应用开发的全链路解决方案。在整个大数据链路中,数据服务将数仓、数据库和数据应用进行串联,形成了一座数据与应用之间的桥梁。数据服务通过将数据封装成数据API的方式,可以为个人、团队及企业提供全面的数据开放及共享能力。借助这个平台,用户能够统一管理面向内外部的API服务。数据服务提供了向下对接数据源、向上支撑业务应用的有效连接。

3417 1
|
存储 分布式计算 DataWorks
|

DataWorks数据安全能力模块介绍及最佳实践 | 《一站式大数据开发治理DataWorks使用宝典》

阿里云DataWorks结合各引擎为企业提供一站式开箱即用的安全能力,这些能力可以覆盖《数据安全能力成熟度模型 GB/T37988—2019》(DSMM)中所述的几个重要的数据安全过程:传输、存储、处理、交换、通用等。

2664 0
|
数据采集 SQL 存储
|

DataWorks数据质量介绍及实践 | 《一站式大数据开发治理DataWorks使用宝典》

数据质量问题虽然从数据工程师的角度来看是个简单问题,但是从业务的角度来看是个很严重的问题。所以数据质量是数据开发和治理全生命周期中,非常重要的一个环节。在DataWorks产品版图里,数据质量也是非常重要的模块之一。

4758 0
|
数据采集 SQL 存储
|

DataWorks数据分析模块 | 《一站式大数据开发治理DataWorks使用宝典》

什么是数据分析?如下图所示,该图描述了数据、信息与情报的关系。我们从外界环境中采集数据,环境可能是软件环境,比如业务系统中的日志数据,也可能是硬件环境,比如采集传感器数据。采集来的原始数据的价值密度通常是比较低的,通过加工、处理、萃取后会得到更有价值的信息,对这个信息进一步的分析与生产,就得到了情报。 总的来说,数据分析是以挖掘有价值的信息并用结论支撑决策为目的,对数据进行探查、清洗、转换和建模的过程。数据分析能够使决策更科学,并帮助企业实现更有效的运营。

1564 0
|
人工智能 运维 分布式计算
|

DataWorks运维中心与移动版介绍 | 《一站式大数据开发治理DataWorks使用宝典》

DataWorks运维中心是对任务进行测试和监控的模块,用户在DataStudio中进行代码开发和调试,将调试的任务经过提交发布操作后,就可以让任务按照调度配置来定时运行。也就是这个时候,任务就从开发环境进入到了生产环境。 对于生产环境中任务的测试、运维、监控等都是在运维中心完成的。运维中心包括三部分:运维大屏、任务运维和智能监控;根据任务运维的触发方式不同,又可以分为:实时任务运维、周期任务运维和手动任务运维。

1839 0
|
SQL 运维 分布式计算
|

数据开发(DataStudio)降本提效的核心利器 | 《一站式大数据开发治理DataWorks使用宝典》

随着阿里集团登月计划的启动和数据中台的发展,DataWorks也进行了多次迭代。2015年DataWorks以D+的形态进入公共云及专有云市场,开始服务政企用户。2016年数加平台发布,数加品牌把DataWorks和MaxCompute这个强有力的组合推向市场。2017、2018和2020年,DataWorks完成了国际化及从2.0到3.0版本的升级。 现在,DataWorks已经成为了一个能够支持多个引擎、多实例以及跨地域调度的强大的大数据生产调度工具了。

2511 1
|
SQL 存储 数据采集
|

DataWorks数据建模 - 一揽子数据模型管理解决方案 | 《一站式大数据开发治理DataWorks使用宝典》

在当下的商业环境中,正确的数据治理策略对于数据增值是非常重要的。据统计,企业的数据一直都在以每年50%的速度增长,因此企业数据治理与整合的难度就不断加大了。 DataWorks一直以来都致力于成为用户更方便、更快捷地进行数据开发与数据治理的好帮手。此次发布的数据建模,是对已有数据治理领域能力的补齐,为用户带来了在数据开发前,实施事前治理的能力。

2747 0
|
消息中间件 分布式计算 DataWorks
|

DataWorks数据集成-大数据上下云的核心枢纽 | 《一站式大数据开发治理DataWorks使用宝典》

数据集成是大数据平台上下云的核心枢纽,它的主要功能是把不同业务系统中的数据进行打通,实现数据自由离线或实时地流动,可以通过丰富的网络解决方案完成数据上下云。

2918 1
|
数据采集 人工智能 运维
|

数据的“敏捷制造”,DataWorks一站式数据开发治理范式演进 | 《一站式大数据开发治理DataWorks使用宝典》

企业大数据技术发展至今,历经了两次蜕变。第一次蜕变从最初的“小作坊”解决大数据问题,到后来企业用各类大数据技术搭建起属于自己的“大平台”,通过平台化的能力完成数据生产力的升级。第二次蜕变让大数据从“大平台”向“敏捷制造”的开发范式演进。基于DataWorks的一站式大数据开发治理的平台,就是这个蜕变最好的佐证。

2099 0
|
存储 数据采集 人工智能
|

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

从2016年诞生起,“中台”概念就一路火热至今,对互联网与金融行业数字化转型产生了极为深远的影响。 作为“中台”概念的提出者和先行者,阿里巴巴用12年的实践探索了中台能力建设和数据应用。在不断升级和重构的过程中,阿里巴巴的中台建设经历了从分散的数据分析到数据中台化能力整合,再到全局数据智能化的时代。

10714 8
|
SQL 运维 分布式计算
|

DataWorks 2021-06 产品月刊

本月DataWorks产品月刊为您带来 产品活动: 1.首月特惠!DataWorks专业版原价5000元现首月特惠仅需199元;独享数据集成/调度资源组首月5折 产品功能更新: 1.数据集成首页改版 2.DataWorks支持EMR实时任务开发运维 3.EMR数据开发任务一键迁移DataWorks 4.DataWorks安全模式绑定EMR集群支持LDAP认证 5.数据服务支持MaxCompute数据源封装API 6.DataWorks新增报警联系人中心 7.运维中心新增资源运维,支持独享资源组水位监控

1048 0
|
DataWorks
|

【商业化通知】DataWorks迁移助手将在2021年8月1日开启商业化

DataWorks迁移助手将在2021年8月1日开启商业化

346 0
|
SQL 分布式计算 DataWorks
|

DataWorks熟能生巧系列直播第三期:DataWorks调度参数配置

本系列文章为DataWorks钉钉大群内熟能生巧系列直播的文字版,基本涵盖了直播中讲解到的大部分内容,大家可以学习或者Mark一下,有需要的时候再来回顾。本系列直播内容由DataWorks技术支持团队出品,运营团队整理,大部分是DataWorks用户实际使用中遇到的频率较高的问题,希望对大家有一定帮助。

2434 0
|
运维 DataWorks 调度
|

DataWorks熟能生巧系列直播第二期:DataWorks调度依赖之跨周期依赖

本系列文章为DataWorks钉钉大群内熟能生巧系列直播的文字版,基本涵盖了直播中讲解到的大部分内容,大家可以学习或者Mark一下,有需要的时候再来回顾。本系列直播内容由DataWorks技术支持团队出品,运营团队整理,大部分是DataWorks用户实际使用中遇到的频率较高的问题,希望对大家有一定帮助。

923 0
|
数据采集 人工智能 DataWorks
|

数据的“敏捷制造”,DataWorks一站式数据开发治理范式演进

企业大数据技术发展至今,历经了两次蜕变。第一次蜕变从最初的“小作坊”解决大数据问题,到后来企业用各类大数据技术搭建起属于自己的“大平台”,通过平台化的能力完成数据生产力的升级。 第二次蜕变让大数据从“大平台”向“敏捷制造”的开发范式演进。在2021阿里云峰会上,阿里巴巴集团副总裁、阿里云智能计算平台事业部高级研究员贾扬清发布基于DataWorks的一站式大数据开发治理的平台,就是这个蜕变最好的佐证。

3125 0
|
SQL 运维 DataWorks
|

DataWorks 2021-05 产品月刊

产品活动: 1.数据集成开放用户体验调研问卷啦!赶紧开启吐槽模式吧 2.首月特惠!DataWorks专业版原价5000元现飞天会员618特惠仅需99元; 产品功能更新: DataWorks数据集成新增实时同步至AnalyticDB MySQL 3.0的功能; 开放消息服务(Open Message)开启公测,支持订阅DataWorks中的元数据及任务变更事件,可实现DataWorks与您的自有系统的深度集成; 任务调度新增年周期和月末最后一天周期,可实现按年、按季度、按指定月最后一天的周期调度; ......

830 0
|
运维 DataWorks 调度
|

DataWorks熟能生巧系列直播第一期:DataWorks调度依赖的基本使用

本系列文章为DataWorks钉钉大群内熟能生巧系列直播的文字版,基本涵盖了直播中讲解到的大部分内容,大家可以学习或者Mark一下,有需要的时候再来回顾。本系列直播内容由DataWorks技术支持团队出品,运营团队整理,大部分是DataWorks用户实际使用中遇到的频率较高的问题,希望对大家有一定帮助。

697 0
|
人工智能 分布式计算 大数据
|

大数据和AI客户案例中心

大数据和AI客户案例中心收集了大多数行业的客户实战案例分享

804 0
|
SQL 分布式计算 DataWorks
|

DataWorks搬站方案:Airflow作业迁移至DataWorks

DataWorks提供任务搬站功能,支持将开源调度引擎Oozie、Azkaban、Airflow的任务快速迁移至DataWorks。本文主要介绍如何将开源Airflow工作流调度引擎中的作业迁移至DataWorks上

1459 0
|
SQL 分布式计算 DataWorks
|

DataWorks搬站方案:Azkaban作业迁移至DataWorks

DataWorks迁移助手提供任务搬站功能,支持将开源调度引擎Oozie、Azkaban、Airflow的任务快速迁移至DataWorks。本文主要介绍如何将开源Azkaban工作流调度引擎中的作业迁移至DataWorks上。

1241 0
|
数据采集 运维 分布式计算
|

DataWorks OpenAPI 数据开发治理实战系列

DataWorks作为飞天大数据平台操作系统,历经11年发展,形成了涵盖数据集成、数据开发、数据治理、数据服务的一站式大数据开发治理平台。很多企业用户在使用产品的过程中希望他们的本地服务能够和阿里云上的DataWorks服务进行交互,从而提升企业大数据处理的效率,减少人工操作和运维工作,降低数据风险和企业成本,现在DataWorks开放OpenAPI能力满足企业的定制化需求。 DataWorks OpenAPI涵盖租户、元数据、数据开发、运维中心、数据质量、数据服务等DataWorks核心能力,企业版和旗舰版分别赠送100万次/月、1000万次/月的免费调用额度。

1214 0
|
运维 DataWorks 安全
|

DataWorks 2021-03 产品月刊

本月DataWorks产品月刊为您带来 产品活动: 1.参与阿里云DataWorks问卷调研 (AliyunUR),赢200元DataWorks无门槛代金券 2.首月特惠!DataWorks专业版原价5000元现仅需199元;独享数据集成/调度资源组首月5折 产品功能更新: 1.全新DataWorks安全中心重磅上线! 2.DataWorks数据服务独享资源组0元公测启动 3.运维中心DAG聚合视图发布,DAG分析功能限时体验中 4.企业版新增DataWorks自定义角色功能

1198 0
|
DataWorks API
|

DataWorks数据服务独享资源组0元公测启动!

DataWorks数据服务独享资源组能够保障数据服务API调用的成功率,满足高QPS、高并发、高频率的接口调用并及时返回数据结果。 数据服务独享资源组正逐步灰度上线公共云,目前面向北京region开通DataWorks产品的用户提供了公测活动。 欢迎北京、深圳region的用户报名开通数据服务独享资源组的限时测试,名额有限,先到先得,不容错过! 如需报名参加限时测试活动,请您申请加入钉钉群“DataWorks数据服务独享资源组限时公测报名群”,群号:35871311。

1307 0
|
数据采集 存储 运维
|

最低0.4折,DataWorks采购季活动开启!

DataWorks采购季折扣一览。专业版新购首月仅需199元,低至0.4折!

572 0
|
消息中间件 存储 运维
|

DataWorks OpenAPI企业开发实战-运维监控大屏

本文将会介绍如何通过使用DataWorks OpenAPI、DataWorks开放元数据、DataWorks开放事件消息三大利器搭建企业自己的DataWorks运维大屏。其中DataWorks OpenAPI已经面向所有企业开放商业化,而DataWorks开放元数据、DataWorks开放事件消息还在邀测中。

1782 0
|
运维 DataWorks 大数据
|

DataWorks OpenAPI-表结构变更时触发任务变更

随着大数据在企业内部使用越来越广泛,很多业务落地慢慢的都依赖大数据的产出结果做为基础,业务的发展遍地开花产生了越来越多的任务,这些任务之间相互依赖也就越来越复杂,慢慢的超过人为可视、可梳理范围;当上游的数据口径发生变更的时候,对下游业务的影响就会形成放射性,影响难以预料,这时候就急需有一种功能来辅助我们的运维人员一起梳理出整个受影响的业务范围,以防数据口径不一致引起资损、或提供错误的数据导致决策失误。

4427 0
|
分布式计算 DataWorks BI
|

DataWorks OpenAPI实现数据资产分布和排行分析

3.1 资产总览: odps项目数量, 表数量,分区表数量,表总大小 3.2 资产分布 按工作空间划分、按所有者划分 3.2(b) 资产分布 按工作空间(名称)划分、按所有者(nick)划分

2087 0
|
SQL 分布式计算 DataWorks
|

DataWorks 2021-02 产品月刊

本月DataWorks产品月刊为您带来 产品活动: 1.参与阿里云DataWorks问卷调研 (AliyunUR),赢200元DataWorks无门槛代金券 2.首月特惠!DataWorks专业版原价5000元现仅需199元;独享数据集成/调度资源组首月5折 3.夺宝计划火热进行中,完成任务即可领取定制礼包 产品功能更新: 1.DataWorks数据服务 - API计量能力全面升级 2.DataWorks数据地图 - 数据发现支持自动和批量创建元数据采集器 3.DataWorks on CDH 持续增强,新增对Kerberos认证支持的强安全使用模式 4.DataWorks数据服务独享资源组

911 0
|
DataWorks 数据建模
|

DataWorks数据建模公开课上线啦!

数据建模是数据标准化的核心内容,企业在搭建自己的数据平台时需要先建设适合公司业务的数据模型。好的数据模型可以帮助企业构建合理的数据基础结构,帮助企业少走弯路,节省长期开发成本。 本次阿里云DataWorks数据建模公开课邀请到Datablau创始人&CEO王琤老师为大家带来数据建模系列讲座,内容涵盖数据建模基本知识和企业级标准、架构与模型设计,以及阿里云DataWorks数据中台模型管理平台解决方案。

4921 2
|
存储 DataWorks 算法
|

依赖DataWorks OpenAPI补数据实现圈人

从2020年10月份起DataWorks为企业版提供了API的能力,我们可以根据现有的API能力打通应用与离线数据加工,从而让大数据能直接为在线应用服务,本篇文章使用圈人功能做一个简单的介绍实现;

2178 0
|
数据采集 运维 DataWorks
|

提效神器,DataWorks OpenAPI开放!

工欲善其数,必先利其器。通过DataWorks OpenAPI 功能,可以快速进行批量操作与系统集成对接,助您显著提升数据开发效率!(DataWorks OpenAPI限企业版及以上版本使用)

2311 0
|
数据采集 分布式计算 运维
|

DataWorks OpenAPI 实战-数据开发全流程介绍

DataWorks作为飞天大数据平台操作系统,历经11年发展,形成了涵盖数据集成、数据开发、数据治理、数据服务的一站式大数据开发治理平台。很多企业用户在使用产品的过程中希望他们的本地服务能够和阿里云上的DataWorks服务进行交互,从而提升企业大数据处理的效率,减少人工操作和运维工作,降低数据风险和企业成本,现在DataWorks开放OpenAPI能力满足企业的定制化需求。

7297 0
|
人工智能 分布式计算 大数据
|

阿里云大数据各行业客户实践案例

本文罗列了部分阿里云上各行业的客户分享案例,包括金融、教育、电商、互娱、游戏、新媒体等几十家客户的心得分享

2297 0
|
存储 分布式计算 DataWorks
|

DataWorks 2020-12 产品月刊

本月DataWorks产品月刊为您带来 产品活动 1.参与阿里云DataWorks问卷调研 (AliyunUR),赢200元DataWorks无门槛代金券 2.首月特惠!DataWorks专业版原价5000元现仅需199元;独享数据集成/调度资源组首月5折 3.夺宝计划火热进行中,完成任务即可领取定制礼包 产品功能更新 1. 一键同步Elasticsearch,DataWorks数据集成MySQL同步到ElasticSearch解决方案上线 2. DataWorks数据建模(DDM)公测啦 3.DataWorks支持CDH(Cloudera Distribution Hadoop)重磅发布

1100 0
|
存储 运维 DataWorks
|

一键实时/离线同步至Elasticsearch,数据集成再添新功能!

企业的实时数据除了存储在大数据引擎中,还有很多非结构化的日志数据,通过阿里云的Elasticsearch,用全托管的方式提供低成本的冷热存储方案,轻松助力企业搭建统一的云上全观测运维监控平台,实现海量数据的实时监控分析,提高自动化运维管理效率。DataWorks数据集成提供了 “MySQL一键实时同步至Elasticsearch” 的解决方案,可以将MySQL中的数据库,通过一次性的简单配置,全增量一体化同步到Elasticsearch,达到数据实时落入ElasticSearch,实时可以用于分析的效果。也可以将MySQL数据库离线全量或者增量搬迁到Elasticsearch中

4111 0
我要发布