开发者社区问答正文

运行Emapreduce后的结果想导出RDS，怎么整？

我在EMR上运行一个按需创建的hive集群进行计算，每天定时启动一次，计算完成时间不定，hive运算结果存储在输入目录下的一个随机id文件夹里面（如指定hive集群日志在oss 的存储目录为 /tmp, 则会在tmp下随机生成一个数字文件名，并存储相关的运行结果），请问数据集成在这个时候怎么样去配置把 oss里面的结果同步到 RDS

展开

收起

封神 2016-05-12 23:03:19 2432 版权

1 条回答

写回答

取消提交回答

封神

专注在大数据分布式计算、数据库及存储领域，拥有13+年大数据引擎、数据仓库、宽表引擎、平台研发经验，6年云智能大数据产品技术一号位经验，10年技术团队管理经验；云智能技术架构/云布道师；研发阿里历代的大数据技术产品包括ODPS、DLA、ADB，最近五年主导宽表引擎研发、DLA、ADB湖仓研发；

这里主要的问题是Emr的hive作业运行完成后，不能通知CDP去运行同步job。
目前可以全部在E-mapreduce的控制平台完成的。
1、第一个job，运行hive
2、第二个job，运行sqoop把数据从hdfs上同步到rds中（可以参考https://yq.aliyun.com/articles/25897?spm=0.0.0.0.6mMzHM）
再新建一个执行计划，把这两个job串联起来。
ps：目前没有加sqoop的作业类型，后续我们会添加的。
目前可以：
选择hadoop作业，作业参数设置为:
;sqoop xxx 也可以跑sqoop，本质就是一个shell

2019-07-17 19:01:31

赞同展开评论

问答分类：

SQL 存储关系型数据库 HIVE 对象存储 RDS 云数据库 RDS MySQL 版数据集成 Data Integration 对象存储日志服务

问答标签：

云数据库 RDS MySQL 版导出云数据库 RDS MySQL 版运行云数据库 RDS运行云数据库 RDS导出导出云数据库 RDS

问答地址：

开发者社区 > 数据库 > 问答

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

运行Emapreduce后的结果想导出RDS，怎么整？

相关文章