文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

DataWorks上使用EMR的开发流程

已解决

DataWorks上使用EMR的开发流程

展开

收起

阿里云服务支持 2022-12-09 09:34:37 296 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

阿里云服务支持

推荐回答

官方回答
1. 在DataWorks上进行EMR任务开发前，为保证开发流程顺利执行，需要分别在EMR侧及DataWorks侧进行相关准备工作。
2. 开发EMR作业
详情请参考：DataWorks On EMR开发流程（必读）
2022-12-09 09:42:49

赞同展开评论
喜欢猪猪

网站：http://ixiancheng.cn/ 微信订阅号：小马哥学JAVA

DataWorks支持基于EMR（E-MapReduce）计算引擎创建Hive、MR、Presto和Spark SQL等节点，实现EMR任务工作流的配置、定时调度和元数据管理等功能，帮助EMR用户更好地产出数据。本文为您介绍使用DataLake（新版数据湖）集群在DataWorks上进行EMR作业的注意事项及开发流程，建议操作前仔细查看。参考地址：https://help.aliyun.com/document_detail/441120.html?spm=a2c6h.13066369.question.23.56636631J8A4tT

2022-12-09 10:43:25

赞同展开评论

问答分类：

DataWorks 大数据开发治理平台 DataWorks

问答标签：

大数据开发治理平台 DataWorks emr dataworks emr emr dataworks 大数据开发治理平台 DataWorks开发流程

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

DataWorks把emr数据源删了再重新创建发现就这样了，后面这个项目空间没删就可以选？

241

1

0

有个dataworks空间已经重新绑定了一个EMR数据源，但是任务一直示：该文件对应引擎实例已失效？

261

1

0

Dataworks on EMR服务中，EMR集群的日常管理和维护工作主要由阿里云负责吗？

232

0

0

dataworks为啥只能读 maxcomputer 不能读 emr 呢？

310

1

0

dataworks能不能把某个数据集从 emr 跑出来以后导入 pai 里面使用？

178

1

0

DataWorks提交任务到 emr 集群跑的时候，在哪里可以设置内存资源？

362

13

0

DataWorks中emr 用这个账号都是可以跑出来结果的怎么办？

203

1

0

云原生大数据计算服务 MaxCompute数据上云方面，DataWorks数据集成是怎样的？

1396

1

0

使用三个odps sql节点，同时向同一张表的同一个分区写入数据，有时报错，有时不会报错，是什么原因

3706

1

0

Dataworks的数据地图可以查看CDH集群 hive的表以及血缘信息嘛

2075

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

收录在圈子:

阿里云支持与服务

2306

+ 订阅

作为全球云计算的领先者，阿里云为全球230万企业提供着云计算服务，服务范围覆盖200多个国家和地区。我们致力于为企业、政府等组织机构提供安全可靠的云计算服务，给用户带来极速愉悦的服务体验。

相关文章

DataWorks AI助理：一句话，帮你搞定研发周报！

企业如何量化品牌在AI回答场景中的曝光表现

基于 DataWorks AI 助理备份实例日志到 OSS 文件系统

阿里云DataWorks数据同步与ETL处理完全指南：从数据集成到数据治理全链路解析

DataWorks数据集成脏数据排查：字段映射、编码格式与容错参数指南

热门讨论

热门文章

数据服务报429请求次数过多咋办呀

数据来源：com.alibaba.fastjson.JSONException: syntax er

在DataWorks上使用PyODPS使用限制是什么？

配置同步任务中的数据... ID=jCvVPH4B1r73GMJAKlKV INDEX=0

请问一下，odps有函数支持分组内排序后取组内第几条数值的吗？比如一个课程有6节课，我要取第3节课

DataWorks这里改不了授权对象是什么情况？

DataWorks中${bdp.system.bizdate}系统不执行，有没有啥替换办法？

dataworks一个业务流程的看板上的节点怎么看有没有定时调度呀，在节点界面调度中有配置定时调度？

DataWorks每个项目空间的空间根节点每天什么时候自动调度？

DataWorks数据地图中是可以查到数据的，但是在【表】中的stg_test01提示不存在？

展开全部

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks售前咨询

DataWorks产品使用合集之如何在不使用用querySql时，指定上游分区

DataWorks AI助理：在钉钉让AI助理帮你盯任务、修问题

DataWorks AI助理：一句话，帮你搞定研发周报！

DataWorks Data Agent：一句话搞定数据开发，让周期从天级到分钟级

DataWorks操作报错合集之在运行数据分析任务时，底层依赖服务alisa.olap.submitjob出现了异常，如何解决

欢迎加入DataWorks产品钉钉交流群

大数据&AI的16种可能，2020阿里云客户最佳实践合集下载

长文详解｜DataWorks Data+AI一体化开发实战图谱

展开全部

还有其他疑问?