开发者社区> 大数据与机器学习> 大数据开发治理DataWorks

大数据开发治理DataWorks

关注

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

0
今日
18292
内容
9
活动
3188
关注

带你读《全链路数据治理-全域数据集成》之18:4. 网络连通解决方案概览

带你读《全链路数据治理-全域数据集成》之18:4. 网络连通解决方案概览

214 0
|
DataWorks 关系型数据库 网络安全
|

带你读《全链路数据治理-全域数据集成》之19:5. 场景(上)

带你读《全链路数据治理-全域数据集成》之19:5. 场景(上)

331 0
|
DataWorks 关系型数据库 网络安全
|

带你读《全链路数据治理-全域数据集成》之19:5. 场景(下)

带你读《全链路数据治理-全域数据集成》之19:5. 场景(下)

236 0
|
网络虚拟化
|

带你读《全链路数据治理-全域数据集成》之20:6. 附录

带你读《全链路数据治理-全域数据集成》之20:6. 附录

208 0
|
弹性计算 数据库
|

带你读《全链路数据治理-全域数据集成》之21:7. 后续步骤

带你读《全链路数据治理-全域数据集成》之21:7. 后续步骤

196 0
|
分布式计算 DataWorks 关系型数据库
|

带你读《全链路数据治理-全域数据集成》之22:1. 背景信息

带你读《全链路数据治理-全域数据集成》之22:1. 背景信息

291 0

带你读《全链路数据治理-全域数据集成》之23:2. 使用限制

带你读《全链路数据治理-全域数据集成》之23:2. 使用限制

197 0
|
分布式计算 DataWorks 关系型数据库
|

带你读《全链路数据治理-全域数据集成》之24:3. 准备工作:添加数据源

带你读《全链路数据治理-全域数据集成》之24:3. 准备工作:添加数据源

232 0
|
SQL 分布式计算 DataWorks
|

带你读《全链路数据治理-全域数据集成》之25:4. 配置任务

带你读《全链路数据治理-全域数据集成》之25:4. 配置任务

275 1
|
运维 DataWorks 调度
|

带你读《全链路数据治理-全域数据集成》之26:5. 提交执行任务

带你读《全链路数据治理-全域数据集成》之26:5. 提交执行任务

286 0
|
运维 DataWorks 关系型数据库
|

带你读《全链路数据治理-全域数据集成》之27:1.背景信息

带你读《全链路数据治理-全域数据集成》之27:1.背景信息

242 0
|
DataWorks 关系型数据库 MySQL
|

带你读《全链路数据治理-全域数据集成》之28:2. 使用限制

带你读《全链路数据治理-全域数据集成》之28:2. 使用限制

179 0
|
弹性计算 关系型数据库 MySQL
|

带你读《全链路数据治理-全域数据集成》之29:3. 准备工作:添加数据源

带你读《全链路数据治理-全域数据集成》之29:3. 准备工作:添加数据源

239 0
|
DataWorks 数据可视化
|

带你读《全链路数据治理-全域数据集成》之30:4. 配置任务(上)

带你读《全链路数据治理-全域数据集成》之30:4. 配置任务(上)

236 0

带你读《全链路数据治理-全域数据集成》之30:4. 配置任务(下)

带你读《全链路数据治理-全域数据集成》之30:4. 配置任务(下)

206 0
|
SQL 运维 关系型数据库
|

带你读《全链路数据治理-全域数据集成》之31:5. 任务运维

带你读《全链路数据治理-全域数据集成》之31:5. 任务运维

259 0
|
存储 分布式计算 运维
|

带你读《全链路数据治理-全域数据集成》之32:1. 背景信息

带你读《全链路数据治理-全域数据集成》之32:1. 背景信息

230 0
|
分布式计算 DataWorks MaxCompute
|

带你读《全链路数据治理-全域数据集成》之33:2. 使用限制

带你读《全链路数据治理-全域数据集成》之33:2. 使用限制

250 0
|
分布式计算 关系型数据库 MySQL
|

带你读《全链路数据治理-全域数据集成》之34:3. 准备工作:添加数据源

带你读《全链路数据治理-全域数据集成》之34:3. 准备工作:添加数据源

261 0
|
分布式计算 DataWorks 关系型数据库
|

带你读《全链路数据治理-全域数据集成》之35:4.任务配置(上)

带你读《全链路数据治理-全域数据集成》之35:4.任务配置(上)

232 0
|
分布式计算 MaxCompute 数据库
|

带你读《全链路数据治理-全域数据集成》之35:4.任务配置(中)

带你读《全链路数据治理-全域数据集成》之35:4.任务配置(中)

199 0
|
SQL 分布式计算 DataWorks
|

带你读《全链路数据治理-全域数据集成》之35:4.任务配置(下)

带你读《全链路数据治理-全域数据集成》之35:4.任务配置(下)

187 0
|
分布式计算 运维 Java
|

带你读《全链路数据治理-全域数据集成》之36:5. 任务运维

带你读《全链路数据治理-全域数据集成》之36:5. 任务运维

306 0
|
数据采集 存储 监控
|

【建议收藏】|某大型金融集团内部数据治理实战总结

近几年,企业都在做数字化转型。 数字化转型是为了使组织更好地适应数字时代的变革,提高效率、降低成本、增强竞争力。是将业务和流程数字化,以实现更快、更准确、更可靠的数据处理和决策。是以数据驱动的精细化运营、业务创新增长和商业模式创新。

1346 0
|
大数据 数据挖掘 测试技术
|

数据项目交付小记:测试报告&公共层&中台组织

最近项目交付上遇到了一些问题,我把自己的回答和想法记录一下,分享给大家。

769 0
|
SQL JSON 分布式计算
|

数据一致性比对(番外)

我写过很多如何去对数、如何批量对数的技术文档,最近项目遇到这个问题,我才发现在官方博客上还没有发布过这个课题的文章。这就像灯下黑,太长用到的知识点,反而没有意识到其重要性。

28734 0
|
人工智能 大数据 分布式计算
|

大数据公共数据集上线,免费试用TB级数据分析

本教程基于大数据AI公共数据集(淘宝、飞猪、阿里音乐、Github、TPC等),通过DataWorks与MaxCompute快速完成大数据分析。

8217 4
|
数据建模 DataWorks 大数据
|

降本提效,3月10日上海数据治理Workshop报名中

降本提效,3月10日上海数据治理Workshop报名中

859 2
|
存储 数据采集 DataWorks
|

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

阿里巴巴一直将数据作为自己的核心资产与能力之一,从最早的淘宝、天猫等电商业务,到后续的优酷、高德、菜鸟等板块,DataWorks、MaxCompute、Hologres等产品用一套技术体系来支持不同业务的发展与创新,为企业带来整体的“数据繁荣”。 数据繁荣为我们带来了红利,同时也带动了各类数据治理需求的井喷,特别是降本等需求的不断出现,阿里云DataWorks团队将13年的产品建设经验整理成最佳实践,从数据生产规范性治理、数据生产稳定性治理、数据生产质量治理、数据应用提效治理、数据安全管控治理、数据成本治理、数据治理组织架构及文化建设等7个方面为大家揭秘数据治理平台建设实践

31429 15
|
SQL 人工智能 运维
|

效率优先,DataWorks全链路数据治理年度发布

DataWorks端到端的全链路数据开发治理平台新能力,回归工具为人服务的本质,全方位地提升我们一线数据开发人员/业务人员的工作效率。

1929 0
|
存储 XML JSON
|

如何选择离线数据集成方案-全量&增量

如何选择数据离线集成方式,哪些表适合全量集成,哪些表适合增量集成

595 1
|
SQL 存储 运维
|

如何选择数据集成方式-离线&实时

如何在项目交付过程中合理经济的选择数据集成方案

360 0
|
DataWorks
|

维度建模实践一例 (一) 维度还是事实

成本和单价是产品的维度还是事实表中的事实?来看看我对这个问题的思考与分享吧。

408 0
|
数据采集 分布式计算 DataWorks
|

阿里云DataWorks荣获DAMA中国数据治理优秀产品奖

2022年12月3日,2022 DAMA中国数据管理峰会(线上部分)成功举行,汇聚多位世界级数据大咖分享,阿里云DataWorks凭借全链路数据治理产品体系,丰富的行业客户最佳实践案例,获得“DAMA中国数据治理优秀产品奖”。

2141 0
|
DataWorks
|

DataWorks售前咨询

DataWorks售前咨询

13598 8
|
运维 分布式计算 DataWorks
|

阿里云大数据助力知衣科技打造AI服装行业核心竞争力

杭州知衣科技有限公司是一家以人工智能技术为驱动的国家高新技术企业,致力于将数据化趋势发现、爆款挖掘和供应链组织能力标准化输出,打造智能化服装设计的供应链平台。

2817 0
|
存储 运维 DataWorks
|

淘系数据模型治理最佳实践

本次分享题目为淘系数据模型治理,主要介绍过去一年淘系数据治理工作的一些总结。

1832 0
|
存储 分布式计算 DataWorks
|

分贝通SAAS企业大数据体系建设经验分享

本文将介绍分贝通在大数据领域的一些建设经验。分贝通在ToB领域是一个年轻的公司,成立六年多,大数据体系刚刚建立一年多,整个团队不到二十人,整体的大数据建设处于初级和摸索的阶段。本次将总结在大数据业务上的实践和思考,希望给大家带来启发。

2251 0
|
存储 机器学习/深度学习 人工智能
|

先进级!阿里云大数据+AI平台通过信通院数据平台整体解决方案最高等级评测

近日,在中国信通院组织的第十四批“可信大数据”产品能力评测中,阿里云计算有限公司顺利完成了首个数据平台整体解决方案评测,达到最高等级先进级(3级)。该评测依据 《集成化大数据平台能力分级要求》进行,共涉及10个能力域,44个能力项和577项技术要求。全方位覆盖大数据平台的数据存储、数据集成、数据管理与治理、数据开发、数据处理及分析、数据服务、高可用、平台管理、系统运维、数据安全等能力。

1897 0
|
存储 DataWorks 安全
|

DataWorks数据治理中心开放使用

DataWorks数据治理中心通过治理健康分量化评估,有效推动治理问题解决。治理健康分由存储、计算、开发、质量和安全五个维度构成,可自动发现和预防各类数据治理问题。在成本治理方面,数据治理中心提供任务资源消耗明细、资源消耗整体趋势、单任务费用预估等丰富功能,可帮助您对各类资源使用费用进行有效的优化控制。

4746 1
|
数据采集 DataWorks 安全
|

IDC:阿里云获2021中国数据治理平台市场份额第一

近日,领先的IT市场研究和咨询公司IDC发布《中国数据治理市场份额,2021:广泛落地,持续增长》报告,报告统计显示2021 年中国数据治理平台市场规模达 23.9 亿元。阿里云以23.4%份额获得2021中国数据治理平台市场份额第一。

1509 0
|
运维 分布式计算 DataWorks
|

阿里大淘系模型治理阶段性分享

阿里大淘系数据体系经过多年发展,通过丰富的数据和产品支撑了复杂的业务场景,在数据领域取得了非常大的领先优势。随着数据规模越来越大,开发人员越来越多,虽有阿里大数据体系规范进行统一管理,但是由于没有在产品侧进行有效的模型设计和管控,在模型规范性、应用层效率、通用层复用性等方面的问题逐渐凸显。计存成本提升、效率降低、规范减弱、数据使用难度变大、运维负担增加等。为了解决这些问题,我们进行了大淘系模型治理专项,在数据服务业务的同时,追求极致的降本提效目标。

2194 2
|
DataWorks 数据建模
|

【商业化通知】DataWorks智能数据建模开启商业化收费

【商业化通知】DataWorks智能数据建模开启商业化收费

1766 0
|
数据采集 SQL 分布式计算
|

DataWorks 2021-12 产品月刊

本月DataWorks产品月刊为您带来 【产品活动】 1. 首月特惠!DataWorks专业版原价5000元现首月特惠仅需199元>> 立即前往>> 2. 首月特惠!独享数据集成/独享调度资源组首月5折>> 立即前往>>

595 0
|
分布式计算 DataWorks Cloud Native
|

阿里云DataWorks通过首批中国信通院数据开发平台与数据分类分级工具评测

近日,中国信通院正式公布了第十三批大数据产品能力评测结果,阿里云DataWorks成为首批通过了“数据开发平台”和"数据分类分级工具"两项基础能力专项评测的产品。

1493 0
|
SQL 存储 运维
|

DataWorks 2021-11 产品月刊

1、数据开发新增资源组编排功能 2、数据集成HDFS Reader和HDFS Writer增加向导开发模式。

939 0
|
DataWorks 数据建模
|

DataWorks智能数据建模全面公测开始啦!

公测期间功能免费使用,创建模型将全部保留!

4340 1
|
自然语言处理 DataWorks 数据建模
|

DataWorks 2021-10 产品月刊

本月DataWorks产品月刊为您带来:1、数据开发新增代码搜索功能;2、数据建模新增命名词典、逆向建模功能;3、DataWorks发布中心公测中

1093 0
|
新零售 人工智能 分布式计算
|

亿滋中国X阿里云,释放新零售的数字化力量

亿滋中国基于阿里云DataWorks与MaxCompute搭建新零售数据中台系统,通过强大的技术平台和数据分析能力,亿滋中国可以提早预知市场动向,制定市场,销售和供应链战略, 更高效地触及消费者锁定消费人群,优化成本模型提升投资回报率,提高销售预测的准确性,实现供应链的柔性生产。

2964 1
|
存储 新零售 分布式计算
|

治理企业“数据悬河”,阿里云DataWorks全链路数据治理新品发布

10月19日,在2021年云栖大会上,阿里云重磅发布DataWorks全链路数据治理产品体系,基于数据仓库,数据湖、湖仓一体等多种大数据架构,DataWorks帮助企业治理内部不断上涨的“数据悬河”,释放企业的数据生产力。

5007 2
我要发布