DataWorksV3.0全新发布,新特性快速一览

本文涉及的产品
大数据开发治理平台DataWorks,资源组抵扣包 750CU*H
简介: DataWorks V3.0全新升级了多引擎架构,在MaxCompute的基础之上,全新支持了开源大数据引擎E-MapReduce、实时计算(Flink)、交互式分析、图计算服务(Graph Compute)。同一个工作空间支持多个引擎实例,方便对业务、任务和表进行统筹管理。同时支持跨地域任务依赖调度,任务调度更加灵活,方便跨地域业务之间协同工作。

DataWorks V3.0发布

• 发布版本:DataWorks V3.0
• 发布时间:2019年12月18日
• 发布范围:全球所有已开通DataWorks的地域
• 发布内容:DataWorks V2.0仅支持MaxCompute计算引擎,DataWorks V3.0全新升级了多引擎架构,在MaxCompute的基础之上,全新支持了开源大数据引擎E-MapReduce、实时计算(Flink)、交互式分析、图计算服务(Graph Compute)。同一个工作空间支持多个引擎实例,方便对业务、任务和表进行统筹管理。同时支持跨地域任务依赖调度,任务调度更加灵活,方便跨地域业务之间协同工作。


DataWorks V3.0 核心特性

1. 支持多种计算引擎
DataWorks V3.0全新升级了多引擎插件化架构,在V2.0版本仅支持MaxCompute计算引擎的基础之上,在MaxCompute的基础之上,全新支持了开源大数据引擎E-MapReduce、实时计算(Realtime Compute)、交互式分析、图计算服务(Graph Compute)。
MaxCompute:
大数据计算服务MaxCompute(原名ODPS)是一种快速、完全托管的EB级大数据计算引擎,是大规模离线数据仓库的核心引擎。DataWorks支持的最早的也是支持的最成熟完备的计算引擎,目前几乎已经覆盖了MaxCompute的所有能力。
E-MapReduce:
E-MapReduce(Elastic MapReduce,简称EMR)是构建于阿里云云服务器ECS上,基于开源的Apache Hadoop和Apache Spark,让您可以方便地使用Hadoop和Spark生态系统中的其他周边系统(例如Hive)来分析和处理自己的数据的大数据引擎服务。DataWorks V3.0全面支持了EMR引擎(限DataWorks标准版及以上版本,目前还需要通过白名单开通),包含元数据、数据地图、数据血缘、数据开发、任务调度、任务运维监控、数据质量控制等能力。
实时计算:
实时计算(Realtime Compute)是一套基于Apache Flink构建的一站式、高性能实时大数据处理平台。DataWorks V3.0全面支持了实时计算引擎,推出了一站式实时计算开发平台Stream Studio,提供可视化拖拽式构建Flink任务的能力,即DAG开发模式。同时支持DAG与Flink SQL互相转换,大大降低了Flink任务开发门槛,提高了开发效率。同时提供了实时任务运维和智能诊断。
交互式分析:
交互式分析(Interactive Analytics)是一种全面兼容PostgreSQL协议并与大数据生态无缝打通的实时交互式分析产品,支持对万亿级数据进行高并发低延时多维分析透视和业务探索,可让您快速对接现有BI工具。DataWorks V3.0全新推出了一站式OLAP开发平台Holo Studio,提供标准化、无门槛的开发管理服务和一站式实时数仓构建服务以及高效、便捷的研发服务,从而提升研发效率。
图计算服务:
图计算服务(Graph Compute,简称GCS)是新一代一站式图数据管理和分析平台,具有数据加载快、规模可扩展、查询延时低(毫秒级)和离在线混合引擎与共享存储等优势。DataWorks V3.0全新推出了图计算开发平台Graph Studio,为图应用开发者提供了实例建模、数据导入、数据查询(Gremlin)、可视化分析等一站式的研发服务。

2.数据分析模块发布
数据分析主要提供表格模式的MaxCompute表操作、电子表格协同编辑和统计分析、可视化报表搭建和分享等核心功能。凭借简单易用的操作界面,使数据变化所见即所得,可视化完成数据的修改和分析、报表的搭建和分享,支持电子表格、可视化报表、维表三种分析形式。
DataWorks数据分析模块全新发布,快速的数据智能洞察平台点击查看

3.自定义节点插件
DataWorks V3.0已经官方支持了丰富的计算引擎,同时推出了自定义节点插件体系(限DataWorks 企业版),允许你以插件的形式自主接入自定义的计算服务或者数据库查询服务,您创建的自定义节点可以享受到与官方提供的节点同样的智能编辑器、任务调度编排、运维监控等开发体验。

4.支持多个引擎实例
DataWorks V2.0的一个工作空间只能支持一个引擎实例(例如对于MaxCompute引擎,一个工作空间只支持创建一个MaxCompute Project),DataWorks V3.0的一个工作空间支持创建或绑定多个引擎实例(限DataWorks专业版及以上版本),让你可以更灵活对业务所需的计算引擎、计算任务、数据表进行统一管理。

5.支持跨地域调度依赖
DataWorks V2.0仅支持同一地域(Region)的任务依赖,DataWorks V3.0支持了同一主账号下(租户)跨地域(限国内地域)的任务依赖(限DataWorks专业版及以上版本),极大了方便了分布在不同地域业务之间进行任务的协同依赖调度。

6.批量上云功能增强
批量上云对于用户来说一个非常快捷的支持现有数据库迁入阿里云的工具,此次改进增强了易用性,覆盖更多的迁移场景,操作也更加具备灵活性。
DataWorksV3.0 批量上云功能增强

相关实践学习
基于Hologres轻量实时的高性能OLAP分析
本教程基于GitHub Archive公开数据集,通过DataWorks将GitHub中的项⽬、行为等20多种事件类型数据实时采集至Hologres进行分析,同时使用DataV内置模板,快速搭建实时可视化数据大屏,从开发者、项⽬、编程语⾔等多个维度了解GitHub实时数据变化情况。
目录
相关文章
【408计算机组成原理】—原码的乘法运算(九)
【408计算机组成原理】—原码的乘法运算(九)
|
Web App开发 移动开发 监控
confluence协同编辑问题处理
confluence协同编辑BUG查询
1277 0
|
弹性计算 负载均衡
阿里云负载均衡怎么配置?
很多人对负载均衡一头雾水,不知道怎么用,流程顺序的是什么的。根据本教程教大家如何使用阿里云的负载均衡······
20453 0
|
11月前
|
容器
深入理解 Flutter 鸿蒙版的 Stack 布局:适配屏幕与层叠样式布局
Flutter 的 Stack 布局组件允许你将多个子组件层叠在一起,实现复杂的界面效果。本文介绍了 Stack 的基本用法、核心概念(如子组件层叠、Positioned 组件和对齐属性),以及如何使用 MediaQuery 和 LayoutBuilder 实现响应式设计。通过示例展示了照片展示与文字描述、动态调整层叠布局等高级用法,帮助你构建更加精美和实用的 Flutter 应用。
466 2
|
存储 搜索推荐 数据挖掘
数据库的应用
数据库在众多领域发挥着重要作用。在企业管理中,它助力客户关系、人力资源和财务管理,提升决策科学性和效率;金融领域中,银行系统、证券交易和保险行业依托数据库保障交易安全、投资决策及风险管理;医疗行业则通过电子病历管理和数据分析提高诊疗准确性并优化资源配置;电子商务运用数据库实现商品、订单管理和用户行为分析,增强购物体验;教育领域中,数据库支持学生信息、教学资源管理和教育数据分析,促进家校沟通与教学质量提升;科学研究方面,数据库促进数据共享、科研项目管理和深入数据分析,加速科学进步。
577 3
|
SQL 分布式计算 DataWorks
实时数仓 Hologres操作报错合集之如何解决报错:internal error: Queryis cancelled
实时数仓Hologres是阿里云推出的一款高性能、实时分析的数据库服务,专为大数据分析和复杂查询场景设计。使用Hologres,企业能够打破传统数据仓库的延迟瓶颈,实现数据到决策的无缝衔接,加速业务创新和响应速度。以下是Hologres产品的一些典型使用场景合集。
ly~
|
传感器 存储 供应链
大数据在供应链管理中的具体应用案例
以下是大数据在供应链管理中的具体应用案例:沃尔玛通过整合内外部数据进行需求预测,提前调配应急物资;亚马逊利用大数据优化库存管理,提高周转率并降低成本;DHL通过传感器收集数据优化物流路线,提升运输效率。大数据的优势在于提高需求预测准确性、优化库存管理、提升物流效率、增强供应商管理和提高供应链可视性,从而实现全方位的供应链优化。
ly~
2873 2
|
Java 测试技术 数据库
Java一分钟之-Mockito:模拟对象测试
【6月更文挑战第4天】Mockito是Java单元测试中的模拟框架,用于创建和配置模拟对象以隔离测试代码。核心概念包括:模拟对象、预期行为(定义方法调用响应)、验证(检查方法调用)和捕获参数。常见问题包括过度模拟、忽略未使用的模拟调用、不恰当配置和误用Mockito注解。解决方案包括正确选择模拟对象、验证所有交互、仔细配置模拟行为及在测试类中正确使用Mockito注解。提供的代码示例展示了如何使用Mockito模拟和验证方法调用,以实现独立且准确的测试。学习和避免这些易错点可提升测试效率和代码质量。
558 0
Java一分钟之-Mockito:模拟对象测试
|
Java 数据库连接 Spring
Spring多数据源配置
Spring多数据源配置
300 0
|
并行计算 PyTorch 算法框架/工具
NumPy 高级教程——GPU 加速
NumPy 高级教程——GPU 加速【1月更文挑战第4篇】
1144 1