文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

DataWorks创建EMR Hive节点操作步骤？

DataWorks创建EMR Hive节点操作步骤？

展开

收起

wenti 2023-01-15 21:13:15 485 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

2 条回答

写回答

取消提交回答

665661

进入数据开发页面。登录DataWorks控制台。在左侧导航栏，单击工作空间列表。选择工作空间所在地域后，单击相应工作空间后的进入数据开发。鼠标悬停至图标，单击EMR > EMR Hive。您也可以找到相应的业务流程，右键单击EMR，选择新建 > EMR Hive。在新建节点对话框中，输入节点名称，并选择目标文件夹。说明节点名称必须是大小写字母、中文、数字、下划线（_）和小数点（.），且不能超过128个字符。单击提交。在节点编辑页面，输入代码。-- SQL语句示例。-- SQL语句最大不能超过130KB。show tables;-- 可以结合调度参数使用。select 'unknown';-- 系统会自动为SELECT语句加上'limit 10000'的限制。select * from userinfo ;调度参数使用详情可参考文档：基础属性：调度参数如果您需要修改代码中的参数赋值，请单击界面上方工具栏的高级运行。参数赋值逻辑详情请参见：运行，高级运行和开发环境冒烟测试赋值逻辑有什么区别相关文档：Hive SQL作业配置说明如果您的工作空间绑定多个EMR引擎，需要选择EMR引擎。如果仅绑定一个EMR引擎，则无需选择。编辑高级配置。"USE_GATEWAY":true ，表示任务会被提交到EMR gateway上执行，默认提交到header节点。"SPARK_CONF": "--conf spark.driver.memory=2g --conf xxx=xxx" ，设置spark 任务运行参数，多个参数在该key中追加。“queue”：提交作业的调度队列，默认为default队列。“vcores”：虚拟核数，默认为1。“memory”：内存，默认为2048MB（用于设置启动器Launcher的内存配额）。“priority”：优先级，默认为1。“FLOW_SKIP_SQL_ANALYZE”：SQL语句执行方式，参数值为false表示每次执行——该回答整理自钉群“DataWorks交流群(答疑@机器人)“

2023-01-15 21:49:02

赞同展开评论
co63oc_

GitHub https://github.com/co63oc/cloud

https://help.aliyun.com/document_detail/137518.html 创建EMR Hive节点

2023-01-15 21:19:01

赞同展开评论

问答分类：

SQL DataWorks HIVE 大数据开发治理平台 DataWorks

问答标签：

大数据开发治理平台 DataWorks节点 dataworks emr 大数据开发治理平台 DataWorks emr emr节点 dataworks Hive

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

阿里云云效

旧版ECM架构的Hadoop集群绑定的Gateway集群节点组在EMR管控无法升配

183

1

0

为什么我的包年包月E-MapReduce集群中按量ECS节点/抢占式ECS实例也会产生EMR服务费

210

1

0

EMR有哪几种节点类型

217

1

0

E-MapReduce续费管理提示存在ECS实例续费时间小于EMR实例续费时间可能导致集群节点...

218

1

0

EMR节点组管理

186

1

0

DataWorks把emr数据源删了再重新创建发现就这样了，后面这个项目空间没删就可以选？

242

1

0

有个dataworks空间已经重新绑定了一个EMR数据源，但是任务一直示：该文件对应引擎实例已失效？

261

1

0

Dataworks on EMR服务中，EMR集群的日常管理和维护工作主要由阿里云负责吗？

232

0

0

dataworks为啥只能读 maxcomputer 不能读 emr 呢？

310

1

0

dataworks能不能把某个数据集从 emr 跑出来以后导入 pai 里面使用？

178

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

收录在圈子:

DataWorks

2707

+ 订阅

相关文章

分布式数据库分片策略怎么设计？透明分片实践 —— 阿里云 PolarDB-X

性能瓶颈的“诊断优先级”：CPU、IO、内存、网络，先查哪个？

数据库 AI 助手是什么？智能运维与诊断详解 —— 阿里云 PolarDB-X

分布式 JOIN 怎么优化？下推、广播、Co-located JOIN 实战 —— 阿里云 PolarDB-X

数据治理工具哪家好？2026年使用体验测评

热门讨论

热门文章

数据服务报429请求次数过多咋办呀

数据来源：com.alibaba.fastjson.JSONException: syntax er

DataWorks这里改不了授权对象是什么情况？

dataworks一个业务流程的看板上的节点怎么看有没有定时调度呀，在节点界面调度中有配置定时调度？

DataWorks中${bdp.system.bizdate}系统不执行，有没有啥替换办法？

在DataWorks上使用PyODPS使用限制是什么？

DataWorks数据地图中是可以查到数据的，但是在【表】中的stg_test01提示不存在？

DataWorks当前使用的ram账户能访问oss，点那个文件夹会报错？

DataWorks每个项目空间的空间根节点每天什么时候自动调度？

DataWorks可以在哪里看到每天新发布的节点吗？

展开全部

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks产品使用合集之如何在不使用用querySql时，指定上游分区

DataWorks售前咨询

DataWorks AI助理：在钉钉让AI助理帮你盯任务、修问题

DataWorks操作报错合集之在运行数据分析任务时，底层依赖服务alisa.olap.submitjob出现了异常，如何解决

DataWorks Data Agent：一句话搞定数据开发，让周期从天级到分钟级

DataWorks AI助理：一句话，帮你搞定研发周报！

DataWorks操作报错合集之在执行SQL查询时遇到报错，代码为[XX000]，该怎么解决

大数据&AI的16种可能，2020阿里云客户最佳实践合集下载

欢迎加入DataWorks产品钉钉交流群

展开全部

还有其他疑问?