备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

DataWorks创建并使用EMR Shell节点创建EMR Shell节点并进行数据开发？

DataWorks创建并使用EMR Shell节点创建EMR Shell节点并进行数据开发？

展开

收起

真的很搞笑 2023-05-14 08:09:34 256 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

进入数据开发页面。登录DataWorks控制台。在左侧导航栏，单击工作空间列表。选择工作空间所在地域后，单击相应工作空间后的进入数据开发。创建业务流程。如果您已有业务流程，则可以忽略该步骤。鼠标悬停至图标，选择业务流程。在新建业务流程对话框，输入业务名称。单击新建创建EMR Shell节点。鼠标悬停至图标，选择EMR > EMR Shell。您也可以找到相应的业务流程，右键单击业务流程，选择新建 > EMR > EMR Shell。在新建节点对话框中，输入节点名称，并选择节点类型及目标文件夹。说明节点名称必须是大小写字母、中文、数字、下划线（_）和小数点（.），且不能超过128个字符。单击提交，进入EMR Shell节点编辑页面。使用EMR Shell节点进行数据开发。示例语句如下。DD=date;echo "hello world, $DD"##可以结合调度参数使用echo unknown;调度参数详情请参见基础属性：调度参数。如果您需要修改代码中的参数赋值，请单击界面上方工具栏的高级运行。参数赋值逻辑详情请参见运行，高级运行和开发环境冒烟测试赋值逻辑有什么区别。更多配置内容，详情请参见Shell作业配置。编辑高级配置。"USE_GATEWAY":true ，表示任务会被提交到EMR gateway上执行，默认提交到header节点。"SPARK_CONF": "--conf spark.driver.memory=2g --conf xxx=xxx" ，设置spark 任务运行参数，多个参数在该key中追加。“queue”：提交作业的调度队列，默认为default队列。“vcores”：虚拟核数，默认为1。“memory”：内存，默认为2048MB（用于设置启动器Laun https://help.aliyun.com/document_detail/214842.html，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-05-14 08:29:21

赞同展开评论

问答分类：

DataWorks Shell 大数据开发治理平台 DataWorks

问答标签：

大数据开发治理平台 DataWorks数据大数据开发治理平台 DataWorks节点大数据开发治理平台 DataWorks开发 Shell数据大数据开发治理平台 DataWorks emr

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

DataWorks 运行spark节点，程序logger日志无法展示

95

0

0

DataWorks支持将A工作空间开发的代码，推送到B工作空间么？

112

1

0

DataWorks有个shell 调 jar 包的任务A，正常会 3 点启动，1.5h 结束？

102

1

0

DataWorks某个shell 节点调jar 包的，经常超时超过 1h 后直接重跑，可以实现吗？

104

1

0

DataWorks手工方式开发覆写了生产表数据，然后去产出表的节点去执行下数据质量校验？

100

1

0

DataWorks把emr数据源删了再重新创建发现就这样了，后面这个项目空间没删就可以选？

117

1

0

有个dataworks空间已经重新绑定了一个EMR数据源，但是任务一直示：该文件对应引擎实例已失效？

147

1

0

在Dataworks中如何配置用户留存模型的任务节点？

98

1

0

DataWorks中hologres sql节点里遇到一个oom的报错？

70

0

0

如何修改EMR集群impala的JVM堆内存大小

180

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关文章

Linux Shell数组元素访问（零基础轻松掌握Bash数组的读取与使用）

Bash 入门

Linux Shell变量删除（从零开始掌握变量清理技巧）

解决mac电脑brew update很慢的问题

构建AI智能体：三十三、LangChain LCEL深度解析：基于Runnable协议的声明式编程新范式

热门讨论

热门文章

阿里云磁盘大小是多少？

数据来源：com.alibaba.fastjson.JSONException: syntax er

咱们这个API Path什么意思呢，是自定义的接口吗？还是统一规范的？

数据服务报429请求次数过多咋办呀

DataWorks中假如odps 有个string字段需要容纳的内容长度超过8M了，我想接进来？

添加资源后如何手动提交和发布？

问一下各位大佬，Dataworks如何能够定义参数获取月份不包含前面的0呢？例如6月份就是6而不是0

DataWorks表管理创建表报precision and scale is not current

DataWorks最近总报线程池满的提示，请问log要在哪里看啊？

DataWorks set odps.service.mode = off;？

展开全部

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

语雀+通义千问+DataWorks，让AI定期推送每周总结

数据中台的智能进化—阿里巴巴十二年数据平台发展历程

DataWorks售前咨询

基于DataWorks搭建新零售数据中台

DataWorks数据服务介绍及最佳实践 | 《一站式大数据开发治理DataWorks使用宝典》

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

DataWorks Copilot：让你的数据质量覆盖率一键飞升！

DataWorks百问百答69：有哪些数据集成报错（数据集成报错归类）？

欢迎加入DataWorks产品钉钉交流群

展开全部

还有其他疑问?