开发者社区 > 大数据与机器学习 > 大数据开发治理DataWorks > 正文

DataWorks上使用EMR的开发流程

已解决

DataWorks上使用EMR的开发流程

展开
收起
阿里云服务支持 2022-12-09 09:34:37 198 0
2 条回答
写回答
取消 提交回答
  • 推荐回答
    官方回答
    1. 在DataWorks上进行EMR任务开发前,为保证开发流程顺利执行,需要分别在EMR侧及DataWorks侧进行相关准备工作。

    2. 开发EMR作业

    详情请参考:DataWorks On EMR开发流程(必读)

    2022-12-09 09:42:49
    赞同 展开评论 打赏
  • 网站:http://ixiancheng.cn/ 微信订阅号:小马哥学JAVA

    DataWorks支持基于EMR(E-MapReduce)计算引擎创建Hive、MR、Presto和Spark SQL等节点,实现EMR任务工作流的配置、定时调度和元数据管理等功能,帮助EMR用户更好地产出数据。本文为您介绍使用DataLake(新版数据湖)集群在DataWorks上进行EMR作业的注意事项及开发流程,建议操作前仔细查看。参考地址:https://help.aliyun.com/document_detail/441120.html?spm=a2c6h.13066369.question.23.56636631J8A4tT

    2022-12-09 10:43:25
    赞同 展开评论 打赏

DataWorks基于MaxCompute/Hologres/EMR/CDP等大数据引擎,为数据仓库/数据湖/湖仓一体等解决方案提供统一的全链路大数据开发治理平台。

相关产品

  • 大数据开发治理平台 DataWorks
  • 相关电子书

    更多
    生命密码-基因数据的EMR实践 立即下载
    超大规模机器学习在EMR的实践 立即下载
    EMR弹性低成本离线大数据分析最佳实践 立即下载