备案控制台

开发者社区

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

dataworks里面支持spark3吗，spark2运行是没问题？

dataworks里面支持spark3吗，spark2运行是没问题？

展开

收起

cuicuicuic 2023-07-25 19:58:54 63 0

2 条回答

写回答

取消提交回答

算精通

北京阿里云ACE会长

在 DataWorks 中，目前支持 Spark2.x 和 Spark3.x 两个版本。如果您的任务是基于 Spark2.x 版本开发的，那么在 DataWorks 中运行是没有问题的；如果您的任务是基于 Spark3.x 版本开发的，也可以在 DataWorks 中运行。不过，需要注意以下几点：

版本兼容性：Spark3.x 版本和 Spark2.x 版本在某些 API 和功能上有所不同，如果您的任务从 Spark2.x 迁移到 Spark3.x，需要注意版本兼容性问题，避免出现不兼容的情况。

环境配置：Spark3.x 版本需要更高版本的 Java 和 Scala 环境支持，如果您需要在 DataWorks 中运行 Spark3.x，需要先进行环境配置，确保 Java 和 Scala 版本符合要求。

资源调度：Spark3.x 版本相比 Spark2.x 版本需要更高的资源要求，需要更多的内存和 CPU 资源来支持，如果您的集群资源较为有限，可能会影响任务的运行效率和稳定性。

2023-07-30 15:49:24

赞同展开评论打赏
Star时光

截至目前（2021年12月），DataWorks在Spark版本选择上仍然支持Spark 2.x系列，尚不支持直接选择Spark 3.x版本。因此，你可以在DataWorks中运行Spark 2.x任务而无需担心兼容性问题。

如果你需要在DataWorks中使用Spark 3.x，目前的解决方案可能是将Spark 3.x作为自定义组件添加到DataWorks中。自定义组件功能允许用户上传和管理自己的组件，包括Spark、Flink等。你可以尝试将Spark 3.x作为自定义组件添加到DataWorks，并进行相应的配置和使用。

2023-07-26 20:37:43

赞同展开评论打赏

问答分类：

DataWorks 大数据开发治理平台 DataWorks

问答标签：

大数据开发治理平台 DataWorks运行大数据开发治理平台 DataWorks spark dataworks apache spark apache spark运行

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关产品：

大数据开发治理平台 DataWorks

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

相关问答

DataWorks请问下。我用dw运行命令超级慢,建个分区要几十秒。有什么参数能加快速度吗？

24

3

0

DataWorks大致就这么多，我在官方文档上看是有ODPS Spark，但是实际看来是并没有的？

31

1

0

DataWorks下面的Datastudio模块没有ODPS Spark了吗，是已经移除了吗？

26

3

0

DataWorks可以拉一个时间段的运行了那些实例吗？

26

2

0

dataworks中ODPS Spark 如何在代码中获取调度参数？

53

2

0

dataworks中Spark节点访问公网有什么限制么？

32

3

0

DataWorks中spark任务是有办法跨空间取表数据吗？

14

1

0

阿里云dataworks运行节点及其下游，报错内部服务错误:创建工作流失败:如何解决？

12

1

0

DataWorks感觉最近的任务运行很慢，这是什么原因呢？

10

0

0

Dataworks运行scala-spark程序一直不动？

17

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关产品

大数据开发治理平台 DataWorks

文档详情产品详情

热门讨论

热门文章

数据服务报429请求次数过多咋办呀

DataWorks我该如何访问A项目安装了项目的package资源？

DataWorks生产节点今天总报：FAILED: 重跑就又可以？

数据来源：com.alibaba.fastjson.JSONException: syntax er

dataworks的数据集成和dataq的数据上云，有什么区别？

为什么执行sql,显示无权限？

dataworks里面的stg层、ods层、dwd层、dws层、是怎么分层的呢？

DataWorks No module named 'aliyunsdkcore'？

DataWorks Parse exception - invalid token '+'？

Dataphin和 Dataworks 有啥区别呢？

展开全部

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

大数据公共数据集上线，免费试用TB级数据分析

欢迎加入DataWorks产品钉钉交流群

DataWorks售前咨询

大数据&AI的16种可能，2020阿里云客户最佳实践合集下载

【2023云栖】田奇铣：大模型驱动DataWorks数据开发治理平台智能化升级

DataWorks产品使用合集之DataWorks发布任务的方法如何解决

DataWorks产品使用合集之DataWorks购买的独享集成资源组退订如何解决

DataWorks产品使用合集之DataWorks中，完成周期任务的开发的步骤如何解决

展开全部

相关课程

更多

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第三阶段

92

25

去学习

大数据实战项目：反爬虫系统（Lua+Spark+Redis+Hadoop框架搭建）第五阶段

125

32

去学习

一站式大数据开发治理平台DataWorks初级课程

399

11

去学习

DataWorks 使用教程

1112

9

去学习

大数据实时计算框架Spark快速入门

778

93

去学习

DataWorks一站式大数据开发治理平台精品课程

7394

35

去学习

相关电子书

更多

DataWorks数据集成实时同步最佳实践（含内测邀请）-2020飞天大数据平台实战应用第一季 立即下载

DataWorks调度任务迁移最佳实践-2020飞天大数据平台实战应用第一季 立即下载

基于DataWorks数据服务构建疫情大屏-2020飞天大数据平台实战应用第一季 立即下载

相关实验场景

更多