大数据开发治理DataWorks-阿里云开发者社区-阿里云

开发者社区> 大数据与机器学习> 大数据开发治理DataWorks

大数据开发治理DataWorks

关注

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

121
今日
15762
内容
7
活动
3015
关注
|
存储 分布式计算 DataWorks
|

DataWorks数据安全能力模块介绍及最佳实践 | 《一站式大数据开发治理DataWorks使用宝典》

阿里云DataWorks结合各引擎为企业提供一站式开箱即用的安全能力,这些能力可以覆盖《数据安全能力成熟度模型 GB/T37988—2019》(DSMM)中所述的几个重要的数据安全过程:传输、存储、处理、交换、通用等。

2309 0
|
数据采集 SQL 存储
|

DataWorks数据质量介绍及实践 | 《一站式大数据开发治理DataWorks使用宝典》

数据质量问题虽然从数据工程师的角度来看是个简单问题,但是从业务的角度来看是个很严重的问题。所以数据质量是数据开发和治理全生命周期中,非常重要的一个环节。在DataWorks产品版图里,数据质量也是非常重要的模块之一。

4060 0
|
数据采集 SQL 存储
|

DataWorks数据分析模块 | 《一站式大数据开发治理DataWorks使用宝典》

什么是数据分析?如下图所示,该图描述了数据、信息与情报的关系。我们从外界环境中采集数据,环境可能是软件环境,比如业务系统中的日志数据,也可能是硬件环境,比如采集传感器数据。采集来的原始数据的价值密度通常是比较低的,通过加工、处理、萃取后会得到更有价值的信息,对这个信息进一步的分析与生产,就得到了情报。 总的来说,数据分析是以挖掘有价值的信息并用结论支撑决策为目的,对数据进行探查、清洗、转换和建模的过程。数据分析能够使决策更科学,并帮助企业实现更有效的运营。

1350 0
|
人工智能 运维 分布式计算
|

DataWorks运维中心与移动版介绍 | 《一站式大数据开发治理DataWorks使用宝典》

DataWorks运维中心是对任务进行测试和监控的模块,用户在DataStudio中进行代码开发和调试,将调试的任务经过提交发布操作后,就可以让任务按照调度配置来定时运行。也就是这个时候,任务就从开发环境进入到了生产环境。 对于生产环境中任务的测试、运维、监控等都是在运维中心完成的。运维中心包括三部分:运维大屏、任务运维和智能监控;根据任务运维的触发方式不同,又可以分为:实时任务运维、周期任务运维和手动任务运维。

1534 0
|
SQL 运维 分布式计算
|

数据开发(DataStudio)降本提效的核心利器 | 《一站式大数据开发治理DataWorks使用宝典》

随着阿里集团登月计划的启动和数据中台的发展,DataWorks也进行了多次迭代。2015年DataWorks以D+的形态进入公共云及专有云市场,开始服务政企用户。2016年数加平台发布,数加品牌把DataWorks和MaxCompute这个强有力的组合推向市场。2017、2018和2020年,DataWorks完成了国际化及从2.0到3.0版本的升级。 现在,DataWorks已经成为了一个能够支持多个引擎、多实例以及跨地域调度的强大的大数据生产调度工具了。

2014 1
|
SQL 存储 数据采集
|

DataWorks数据建模 - 一揽子数据模型管理解决方案 | 《一站式大数据开发治理DataWorks使用宝典》

在当下的商业环境中,正确的数据治理策略对于数据增值是非常重要的。据统计,企业的数据一直都在以每年50%的速度增长,因此企业数据治理与整合的难度就不断加大了。 DataWorks一直以来都致力于成为用户更方便、更快捷地进行数据开发与数据治理的好帮手。此次发布的数据建模,是对已有数据治理领域能力的补齐,为用户带来了在数据开发前,实施事前治理的能力。

2302 0
|
消息中间件 分布式计算 DataWorks
|

DataWorks数据集成-大数据上下云的核心枢纽 | 《一站式大数据开发治理DataWorks使用宝典》

数据集成是大数据平台上下云的核心枢纽,它的主要功能是把不同业务系统中的数据进行打通,实现数据自由离线或实时地流动,可以通过丰富的网络解决方案完成数据上下云。

2555 1
|
数据采集 人工智能 运维
|

数据的“敏捷制造”,DataWorks一站式数据开发治理范式演进 | 《一站式大数据开发治理DataWorks使用宝典》

企业大数据技术发展至今,历经了两次蜕变。第一次蜕变从最初的“小作坊”解决大数据问题,到后来企业用各类大数据技术搭建起属于自己的“大平台”,通过平台化的能力完成数据生产力的升级。第二次蜕变让大数据从“大平台”向“敏捷制造”的开发范式演进。基于DataWorks的一站式大数据开发治理的平台,就是这个蜕变最好的佐证。

1655 0
|
存储 数据采集 人工智能
|

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

从2016年诞生起,“中台”概念就一路火热至今,对互联网与金融行业数字化转型产生了极为深远的影响。 作为“中台”概念的提出者和先行者,阿里巴巴用12年的实践探索了中台能力建设和数据应用。在不断升级和重构的过程中,阿里巴巴的中台建设经历了从分散的数据分析到数据中台化能力整合,再到全局数据智能化的时代。

7585 7
|
SQL 运维 分布式计算
|

DataWorks 2021-06 产品月刊

本月DataWorks产品月刊为您带来 产品活动: 1.首月特惠!DataWorks专业版原价5000元现首月特惠仅需199元;独享数据集成/调度资源组首月5折 产品功能更新: 1.数据集成首页改版 2.DataWorks支持EMR实时任务开发运维 3.EMR数据开发任务一键迁移DataWorks 4.DataWorks安全模式绑定EMR集群支持LDAP认证 5.数据服务支持MaxCompute数据源封装API 6.DataWorks新增报警联系人中心 7.运维中心新增资源运维,支持独享资源组水位监控

909 0
|
DataWorks
|

【商业化通知】DataWorks迁移助手将在2021年8月1日开启商业化

DataWorks迁移助手将在2021年8月1日开启商业化

283 0
|
SQL 分布式计算 DataWorks
|

DataWorks熟能生巧系列直播第三期:DataWorks调度参数配置

本系列文章为DataWorks钉钉大群内熟能生巧系列直播的文字版,基本涵盖了直播中讲解到的大部分内容,大家可以学习或者Mark一下,有需要的时候再来回顾。本系列直播内容由DataWorks技术支持团队出品,运营团队整理,大部分是DataWorks用户实际使用中遇到的频率较高的问题,希望对大家有一定帮助。

2060 0
|
运维 DataWorks 调度
|

DataWorks熟能生巧系列直播第二期:DataWorks调度依赖之跨周期依赖

本系列文章为DataWorks钉钉大群内熟能生巧系列直播的文字版,基本涵盖了直播中讲解到的大部分内容,大家可以学习或者Mark一下,有需要的时候再来回顾。本系列直播内容由DataWorks技术支持团队出品,运营团队整理,大部分是DataWorks用户实际使用中遇到的频率较高的问题,希望对大家有一定帮助。

736 0
|
数据采集 人工智能 DataWorks
|

数据的“敏捷制造”,DataWorks一站式数据开发治理范式演进

企业大数据技术发展至今,历经了两次蜕变。第一次蜕变从最初的“小作坊”解决大数据问题,到后来企业用各类大数据技术搭建起属于自己的“大平台”,通过平台化的能力完成数据生产力的升级。 第二次蜕变让大数据从“大平台”向“敏捷制造”的开发范式演进。在2021阿里云峰会上,阿里巴巴集团副总裁、阿里云智能计算平台事业部高级研究员贾扬清发布基于DataWorks的一站式大数据开发治理的平台,就是这个蜕变最好的佐证。

2917 0
|
SQL 运维 DataWorks
|

DataWorks 2021-05 产品月刊

产品活动: 1.数据集成开放用户体验调研问卷啦!赶紧开启吐槽模式吧 2.首月特惠!DataWorks专业版原价5000元现飞天会员618特惠仅需99元; 产品功能更新: DataWorks数据集成新增实时同步至AnalyticDB MySQL 3.0的功能; 开放消息服务(Open Message)开启公测,支持订阅DataWorks中的元数据及任务变更事件,可实现DataWorks与您的自有系统的深度集成; 任务调度新增年周期和月末最后一天周期,可实现按年、按季度、按指定月最后一天的周期调度; ......

712 0
|
运维 DataWorks 调度
|

DataWorks熟能生巧系列直播第一期:DataWorks调度依赖的基本使用

本系列文章为DataWorks钉钉大群内熟能生巧系列直播的文字版,基本涵盖了直播中讲解到的大部分内容,大家可以学习或者Mark一下,有需要的时候再来回顾。本系列直播内容由DataWorks技术支持团队出品,运营团队整理,大部分是DataWorks用户实际使用中遇到的频率较高的问题,希望对大家有一定帮助。

577 0
|
人工智能 分布式计算 大数据
|

大数据和AI客户案例中心

大数据和AI客户案例中心收集了大多数行业的客户实战案例分享

543 0
|
SQL 分布式计算 DataWorks
|

DataWorks搬站方案:Airflow作业迁移至DataWorks

DataWorks提供任务搬站功能,支持将开源调度引擎Oozie、Azkaban、Airflow的任务快速迁移至DataWorks。本文主要介绍如何将开源Airflow工作流调度引擎中的作业迁移至DataWorks上

1224 0
|
SQL 分布式计算 DataWorks
|

DataWorks搬站方案:Azkaban作业迁移至DataWorks

DataWorks迁移助手提供任务搬站功能,支持将开源调度引擎Oozie、Azkaban、Airflow的任务快速迁移至DataWorks。本文主要介绍如何将开源Azkaban工作流调度引擎中的作业迁移至DataWorks上。

1067 0
|
数据采集 运维 分布式计算
|

DataWorks OpenAPI 数据开发治理实战系列

DataWorks作为飞天大数据平台操作系统,历经11年发展,形成了涵盖数据集成、数据开发、数据治理、数据服务的一站式大数据开发治理平台。很多企业用户在使用产品的过程中希望他们的本地服务能够和阿里云上的DataWorks服务进行交互,从而提升企业大数据处理的效率,减少人工操作和运维工作,降低数据风险和企业成本,现在DataWorks开放OpenAPI能力满足企业的定制化需求。 DataWorks OpenAPI涵盖租户、元数据、数据开发、运维中心、数据质量、数据服务等DataWorks核心能力,企业版和旗舰版分别赠送100万次/月、1000万次/月的免费调用额度。

1018 0
|
运维 DataWorks 安全
|

DataWorks 2021-03 产品月刊

本月DataWorks产品月刊为您带来 产品活动: 1.参与阿里云DataWorks问卷调研 (AliyunUR),赢200元DataWorks无门槛代金券 2.首月特惠!DataWorks专业版原价5000元现仅需199元;独享数据集成/调度资源组首月5折 产品功能更新: 1.全新DataWorks安全中心重磅上线! 2.DataWorks数据服务独享资源组0元公测启动 3.运维中心DAG聚合视图发布,DAG分析功能限时体验中 4.企业版新增DataWorks自定义角色功能

1062 0
|
DataWorks API
|

DataWorks数据服务独享资源组0元公测启动!

DataWorks数据服务独享资源组能够保障数据服务API调用的成功率,满足高QPS、高并发、高频率的接口调用并及时返回数据结果。 数据服务独享资源组正逐步灰度上线公共云,目前面向北京region开通DataWorks产品的用户提供了公测活动。 欢迎北京、深圳region的用户报名开通数据服务独享资源组的限时测试,名额有限,先到先得,不容错过! 如需报名参加限时测试活动,请您申请加入钉钉群“DataWorks数据服务独享资源组限时公测报名群”,群号:35871311。

1258 0
|
数据采集 存储 运维
|

最低0.4折,DataWorks采购季活动开启!

DataWorks采购季折扣一览。专业版新购首月仅需199元,低至0.4折!

485 0
|
消息中间件 存储 运维
|

DataWorks OpenAPI企业开发实战-运维监控大屏

本文将会介绍如何通过使用DataWorks OpenAPI、DataWorks开放元数据、DataWorks开放事件消息三大利器搭建企业自己的DataWorks运维大屏。其中DataWorks OpenAPI已经面向所有企业开放商业化,而DataWorks开放元数据、DataWorks开放事件消息还在邀测中。

1626 0
|
运维 DataWorks 大数据
|

DataWorks OpenAPI-表结构变更时触发任务变更

随着大数据在企业内部使用越来越广泛,很多业务落地慢慢的都依赖大数据的产出结果做为基础,业务的发展遍地开花产生了越来越多的任务,这些任务之间相互依赖也就越来越复杂,慢慢的超过人为可视、可梳理范围;当上游的数据口径发生变更的时候,对下游业务的影响就会形成放射性,影响难以预料,这时候就急需有一种功能来辅助我们的运维人员一起梳理出整个受影响的业务范围,以防数据口径不一致引起资损、或提供错误的数据导致决策失误。

4297 0
|
分布式计算 DataWorks BI
|

DataWorks OpenAPI实现数据资产分布和排行分析

3.1 资产总览: odps项目数量, 表数量,分区表数量,表总大小 3.2 资产分布 按工作空间划分、按所有者划分 3.2(b) 资产分布 按工作空间(名称)划分、按所有者(nick)划分

1949 0
|
SQL 分布式计算 DataWorks
|

DataWorks 2021-02 产品月刊

本月DataWorks产品月刊为您带来 产品活动: 1.参与阿里云DataWorks问卷调研 (AliyunUR),赢200元DataWorks无门槛代金券 2.首月特惠!DataWorks专业版原价5000元现仅需199元;独享数据集成/调度资源组首月5折 3.夺宝计划火热进行中,完成任务即可领取定制礼包 产品功能更新: 1.DataWorks数据服务 - API计量能力全面升级 2.DataWorks数据地图 - 数据发现支持自动和批量创建元数据采集器 3.DataWorks on CDH 持续增强,新增对Kerberos认证支持的强安全使用模式 4.DataWorks数据服务独享资源组

839 0
|
DataWorks 数据建模
|

DataWorks数据建模公开课上线啦!

数据建模是数据标准化的核心内容,企业在搭建自己的数据平台时需要先建设适合公司业务的数据模型。好的数据模型可以帮助企业构建合理的数据基础结构,帮助企业少走弯路,节省长期开发成本。 本次阿里云DataWorks数据建模公开课邀请到Datablau创始人&CEO王琤老师为大家带来数据建模系列讲座,内容涵盖数据建模基本知识和企业级标准、架构与模型设计,以及阿里云DataWorks数据中台模型管理平台解决方案。

4578 2
|
存储 DataWorks 算法
|

依赖DataWorks OpenAPI补数据实现圈人

从2020年10月份起DataWorks为企业版提供了API的能力,我们可以根据现有的API能力打通应用与离线数据加工,从而让大数据能直接为在线应用服务,本篇文章使用圈人功能做一个简单的介绍实现;

1968 0
|
数据采集 运维 DataWorks
|

提效神器,DataWorks OpenAPI开放!

工欲善其数,必先利其器。通过DataWorks OpenAPI 功能,可以快速进行批量操作与系统集成对接,助您显著提升数据开发效率!(DataWorks OpenAPI限企业版及以上版本使用)

1925 0
|
数据采集 分布式计算 运维
|

DataWorks OpenAPI 实战-数据开发全流程介绍

DataWorks作为飞天大数据平台操作系统,历经11年发展,形成了涵盖数据集成、数据开发、数据治理、数据服务的一站式大数据开发治理平台。很多企业用户在使用产品的过程中希望他们的本地服务能够和阿里云上的DataWorks服务进行交互,从而提升企业大数据处理的效率,减少人工操作和运维工作,降低数据风险和企业成本,现在DataWorks开放OpenAPI能力满足企业的定制化需求。

6924 0
|
机器学习/深度学习 新零售 人工智能
|

阿里云大数据各行业客户实践案例

本文罗列了部分阿里云上各行业的客户分享案例,包括金融、教育、电商、互娱、游戏、新媒体等几十家客户的心得分享

1923 0
|
存储 分布式计算 DataWorks
|

DataWorks 2020-12 产品月刊

本月DataWorks产品月刊为您带来 产品活动 1.参与阿里云DataWorks问卷调研 (AliyunUR),赢200元DataWorks无门槛代金券 2.首月特惠!DataWorks专业版原价5000元现仅需199元;独享数据集成/调度资源组首月5折 3.夺宝计划火热进行中,完成任务即可领取定制礼包 产品功能更新 1. 一键同步Elasticsearch,DataWorks数据集成MySQL同步到ElasticSearch解决方案上线 2. DataWorks数据建模(DDM)公测啦 3.DataWorks支持CDH(Cloudera Distribution Hadoop)重磅发布

1034 0
|
存储 运维 DataWorks
|

一键实时/离线同步至Elasticsearch,数据集成再添新功能!

企业的实时数据除了存储在大数据引擎中,还有很多非结构化的日志数据,通过阿里云的Elasticsearch,用全托管的方式提供低成本的冷热存储方案,轻松助力企业搭建统一的云上全观测运维监控平台,实现海量数据的实时监控分析,提高自动化运维管理效率。DataWorks数据集成提供了 “MySQL一键实时同步至Elasticsearch” 的解决方案,可以将MySQL中的数据库,通过一次性的简单配置,全增量一体化同步到Elasticsearch,达到数据实时落入ElasticSearch,实时可以用于分析的效果。也可以将MySQL数据库离线全量或者增量搬迁到Elasticsearch中

3819 0
|
SQL 分布式计算 关系型数据库
|

DataWorks百问百答69:有哪些数据集成报错(数据集成报错归类)?

数据集成报错归类

9459 0
|
DataWorks 分布式计算 MaxCompute
|

DataWorks OpenAPI 示例(元数据模块)

DataWorks OpenAPI 示例

4650 0
|
分布式计算 DataWorks 数据建模
|

DataWorks数据建模(DDM)公测啦!

为帮助广大企业用户合理规划与建立云上数据仓库、落地并夯实企业数据治理项目,达到落实数据标准、提升数据可用性目的,阿里云DataWorks联合建模工具DDM(Datablau Data Modeler)为您提供一体化的数据建模解决方案,将数据模型设计管控、引标落标等能力融入DataWorks规范化开发流程,助力用户实现数据资产价值化输出,在数据全生命周期上夯实数据基础,为企业的数据价值化提供有力支撑。

1751 0
|
存储 分布式计算 运维
|

阿里云实时大数据解决方案,助力企业实时分析与决策

简介: 2020年双11,云原生实时数仓首次在阿里巴巴双11核心数据场景落地,实现商业全链路实时化,毫秒级海量数据处理能力。搜索推荐业务数据开发效率提升4倍,菜鸟物流包裹数据链路从小时级优化到3分钟,考拉分钟及小时业务1分钟内完成,大数据的实时分析与决策在瞬息万变的市场竞争中成为了标品!今天,我们将向大家分享阿里云实时大数据解决方案,助力企业实时决策。

3809 1
|
分布式计算 运维 DataWorks
|

DataWorks学习路径

DataWorks学习路径

3887 2
|
SQL 分布式计算 DataWorks
|

DataWorks 2020-11 产品月刊

本月DataWorks产品月刊为您带来 产品活动: 1.首月特惠!DataWorks专业版原价5000元现仅需199元;独享数据集成/调度资源组首月5折 2.夺宝计划火热进行中,完成任务即可领取定制礼包。 产品功能更新: 1.性能高1倍,价格低3/4!数据库实时同步新选择! 2.DataWorks数据集成推出同步解决方案模块 3.DataWorks数据服务-脚本模式升级

13979 0
|
分布式计算 运维 DataWorks
|

性能高1倍,价格低3/4!数据库实时同步新选择!

2020年双11,云原生实时数仓首次在阿里巴巴双11核心数据场景落地,实现商业全链路实时化,毫秒级海量数据处理能力。搜索推荐业务数据开发效率提升4倍,菜鸟物流包裹数据链路从小时级优化到3分钟,考拉分钟及小时业务1分钟内完成,实时数据仓库的建设在瞬息万变的市场竞争中成为了标品!

7695 0
|
人工智能 自然语言处理 分布式计算
|

您身边的AI管家-58到家人工智能实践

本文详述了58到家业务上的难点和挑战,包括在智能营销、到店分流和登记、多元匹配、销售、业务与社会安全等方面,以及他们是如何通过阿里云大数据平台去应对家庭服务行业在互联网化过程当中的痛点和挑战。

5298 0
|
存储 消息中间件 分布式计算
|

小红书推荐大数据在阿里云上的实践

本篇内容主要分三个部分,在第一部分讲一下实时计算在推荐业务中的使用场景。第二部分讲一下小红书是怎么使用Flink的一些新的功能。第三部分主要是讲一些OLAP的实时分析的场景,以及和阿里云MC-Hologres的合作。

9832 0
|
机器学习/深度学习 人工智能 自然语言处理
|

数据上云,AI驱动,宝宝树如何服务千万年轻妈妈

本文讲述了宝宝树通过阿里云大数据平台构建了个性化的大数据架构,并在此基础上使用AI和深度学习技术实现了一些业务工具,进而支撑业务展开,实现业务价值。

2565 0
|
缓存 运维 分布式计算
|

快狗打车平滑上云架构方案

快狗打车原名58速运,是同城即时货运平台。目前支持拉货、搬家和运东西等一些业务。本文讲述了快狗打车上云的缘由,如何平滑地、客户无感知地上云以及上云给快狗打车带来的价值。

3161 0
|
机器学习/深度学习 分布式计算 DataWorks
|

批批网在B2B电商领域的搜索业务探索之路

本次分享包含4个部分,第一个是批批网的介绍,第二个是曲折的搜索之路,第三搜索之路柳暗花明,也就是我们使用了OpenSearch之后,我们得到了哪些好处。第四,搜索之路未来可期。

3345 0
|
机器学习/深度学习 存储 人工智能
|

微博机器学习平台云上最佳实践

本文讲述了微博机器学习平台和深度学习平台的业务功能和云上实践,剖析了阿里云大数据在微博这两大学习平台的架构建设上所起到的作用。

5787 0
|
存储 新零售 运维
|

基于Elasticsearch的商家服务解决方案

本文讲述了在电商新零售行业下,电商服务商爱用科技如何借助Elasticsearch,应对在业务系统中的大规模交易订单数据管理,以及全观测日志运维场景下的痛点和挑战,为其百万电商商家用户提供稳定高效的商家服务。

2864 0
|
机器学习/深度学习 人工智能 运维
|

智能风控未来已来

本文主要会分享三个方面的内容,由小红书反作弊的策略和算法负责人 汪浩然讲讲他和阿里风控的故事、阿里云的风控产品赋能以及阿里的机器学习平台赋能,最后介绍一下智能风控以及智能风控依靠的云计算能力。

5044 0
|
存储 SQL 弹性计算
|

金融科技数据湖构建和管理之道

上海数禾信息科技有限公司是一家拥有小贷牌照和融资担保牌照的金融科技公司(下称“数禾科技”),公司的核心产品是“还呗”。本文要分享的主题是数禾科技如何在云上构建和管理数据湖。

3250 0
我要发布