文档备案控制台

开发者社区大数据与机器学习大数据开发治理DataWorks 正文

DataWorks数据加工配置EMR Hive节点是什么？

DataWorks数据加工配置EMR Hive节点是什么？

展开

收起

真的很搞笑 2023-09-10 14:06:58 210 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

芯在这

配置ods_log_info_d节点。双击ods_log_info_d节点，进入节点配置页面。在节点编辑页面，编写如下语句。说明如果您的工作空间绑定多个EMR引擎，需要选择EMR引擎。如果仅绑定一个EMR引擎，则无需选择。--创建ODS层表CREATE TABLE IF NOT EXISTS ods_log_info_d (ip STRING COMMENT 'ip地址',uid STRING COMMENT '用户ID',time STRING COMMENT '时间yyyymmddhh:mi:ss',status STRING COMMENT '服务器返回状态码',bytes STRING COMMENT '返回给客户端的字节数',region STRING COMMENT '地域，根据ip得到',method STRING COMMENT 'http请求类型',url STRING COMMENT 'url',protocol STRING COMMENT 'http协议版本号',referer STRING COMMENT '来源url',device STRING COMMENT '终端类型 ',identity STRING COMMENT '访问类型 crawler feed user unknown')PARTITIONED BY (dt STRING);create function getregion as 'org.alidata.emr.udf.Ip2Region'using jar 'oss://dw-emr-demo/ip2region/ip2region-emr.jar';ALTER TABLE ods_log_info_d ADD IF NOT EXISTS PARTITION (dt=unknown);set hive.vectorized.execution.enabled = false;INSERT OVERWRITE TABLE ods_log_info_d PARTITION (dt=unknown)SELECT ip, uid, tm, status, bytes, getregion(ip) AS region --使用自定义UDF通过ip得到地域。, regexp_extract(request,
https://help.aliyun.com/document_detail/146698.html，此回答整理自钉群“DataWorks交流群(答疑@机器人)”

2023-09-10 19:48:10

赞同展开评论

问答分类：

SQL DataWorks HIVE 大数据开发治理平台 DataWorks

问答标签：

大数据开发治理平台 DataWorks数据大数据开发治理平台 DataWorks节点数据emr 配置Hive 大数据开发治理平台 DataWorks emr

问答地址：

开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 问答

相关问答

旧版ECM架构的Hadoop集群绑定的Gateway集群节点组在EMR管控无法升配

182

1

0

dataworks中的sql是基于hive sql吗？

423

3

0

DataWorks把emr数据源删了再重新创建发现就这样了，后面这个项目空间没删就可以选？

240

1

0

有个dataworks空间已经重新绑定了一个EMR数据源，但是任务一直示：该文件对应引擎实例已失效？

258

1

0

Dataworks on EMR服务中，EMR集群的日常管理和维护工作主要由阿里云负责吗？

231

0

0

dataworks为啥只能读 maxcomputer 不能读 emr 呢？

307

1

0

dataworks能不能把某个数据集从 emr 跑出来以后导入 pai 里面使用？

175

1

0

DataWorks提交任务到 emr 集群跑的时候，在哪里可以设置内存资源？

361

13

0

DataWorks中emr 用这个账号都是可以跑出来结果的怎么办？

200

1

0

DataWorks不是一个账户的hive数据可以同步到odps吗？

225

1

0

大数据与机器学习

大数据开发治理DataWorks

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎，为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

我要提问

相关文章

AI 工具周报：语音交互、Agent 评测与低成本推理的技术启示

省掉一套向量集群后我的RAG架构反而更快了，多模融合到底怎么做

慢接口排查指南：从 APM 链路追踪到 SQL 执行计划的系统化方法论

团队暂时没有条件部署 SkyWalking

一条SQL同时处理结构化条件和非结构化语义匹配。

相关解决方案

更多

基于数据闪回，快速恢复数据

海量异构数据预处理破局之道

分析 Agent 实现一键 AI 数据洞察

多模态数据信息提取

高效存储和处理多媒体数据

热门讨论

热门文章

在DataWorks上使用PyODPS使用限制是什么？

数据来源：com.alibaba.fastjson.JSONException: syntax er

配置同步任务中的数据... ID=jCvVPH4B1r73GMJAKlKV INDEX=0

数据服务报429请求次数过多咋办呀

有使用dataworks结合MDM进行主数据项目实施的吗？

DataWorks假设我要在PyODPS中查询test中的表，我应该怎么写语句？

请问一下，odps有函数支持分组内排序后取组内第几条数值的吗？比如一个课程有6节课，我要取第3节课

DataWorks在哪里查看当前购买的是什么版本呢？

maxcompute 和odps的关系是什么啊，我第一次做这个，有点不懂

DataWorks中语义分析异常-无法解析怎么办？

展开全部

2万字揭秘阿里巴巴数据治理平台DataWorks建设实践

DataWorks AI助理：一句话，帮你搞定研发周报！

DataWorks售前咨询

DataWorks AI助理：在钉钉让AI助理帮你盯任务、修问题

DataWorks Data Agent：一句话搞定数据开发，让周期从天级到分钟级

长文详解｜DataWorks Data+AI一体化开发实战图谱

DataWorks数据源问题之数据集成任务报错如何解决

语雀+通义千问+DataWorks，让AI定期推送每周总结

DataWorks：新一代 Data+AI 数据开发与数据治理平台演进

大数据&AI的16种可能，2020阿里云客户最佳实践合集下载

展开全部

还有其他疑问?