开发者社区云原生文章正文

大数据任务调度工具 Apache DolphinScheduler

2023-07-06 1149

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 大数据任务调度工具 Apache DolphinScheduler

@[toc]

大数据任务调度工具 Apache DolphinScheduler

项目亮点

专门针对大数据平台
国人开发
支持单机、集群、容器化
项目比较新，2019 年开发

DolphinScheduler 简介

Apache DolphinScheduler 于 17 年在易观数科立项， 19 年 3 月开源，8 月进入 Apache 孵化器

DolphinScheduler 支持 K8S

调度系统选型

竞争产品

Airflow
Oozie
Kettle
xxl-job
Azkaban
Spring Batch
DolphinScheduler

以上的调度系统基本都是基于 Java 开发，底层都依赖于 Quartz 实现

为什么大数据要选择 DolphinScheduler

DolphinScheduler 的定位是大数据、工作流 2 个方向，Kettle、xxl-job、Spring Batch 虽然可以做任务调度，但是不是专门针对大数据领域的

DolphinScheduler 的技术栈

后端: SpringBoot (2.x)

前端: VUE

编译: Maven(3.3+) ,

元数据存储: Mysql5.5+

分布式无中心化设计: ZooKeeper(3.4.6+)

统一资源管理 : 共享存储[HDFS、S3A、MinIO]

文章标签：

云原生大数据计算服务 MaxCompute

Java

JavaScript

容器

Kubernetes

Apache

Spring

Maven

调度

存储

大数据

关键词：

云原生大数据计算服务 MaxCompute工具

云原生大数据计算服务 MaxCompute apache

Apache大数据

云原生大数据计算服务 MaxCompute任务调度

Apache工具

相关实践学习

基于MaxCompute的热门话题分析

Apsara Clouder大数据专项技能认证配套课程：基于MaxCompute的热门话题分析

online_zuozuo

牧羊吖

7月前

SQL 人工智能分布式计算

拥抱数据洪流：ODPS，从工具到智能基石的认知跃迁

ODPS正从计算工具进化为智能基石，重塑数据价值链条。它不仅是效率引擎，更是决策资产、信任桥梁与预见系统。其创新架构支持存算分离、AI融合计算与隐私保护，助力企业迎接AI革命。未来，ODPS将推动绿色智能，成为组织数字化转型的核心支撑平台。

牧羊吖

209 3 3

Echo_Wish

12月前

分布式计算大数据数据处理

从Excel到大数据：别让工具限制你的思维！

Echo_Wish

473 85 86

小Lee

存储分布式计算数据可视化

大数据常用技术与工具

【10月更文挑战第16天】

小Lee

803 4 4

Echo_Wish

9月前

人工智能算法自动驾驶

AI和大数据：是工具，还是操控人心的“隐形之手”？

Echo_Wish

211 1 1

Echo_Wish

分布式计算大数据流计算

玩转数据：初学者的大数据处理工具指南

Echo_Wish

373 14 14

游客kufrkwrbkmpsa

11月前

JSON 分布式计算 DataX

【YashanDB知识库】使用DataX工具迁移yashan数据到maxcompute

本文介绍使用崖山适配的DataX工具进行数据库迁移的方法，包括单表迁移和批量表迁移。单表迁移需配置json文件并执行同步命令；批量迁移则通过脚本自动化生成json配置文件并完成数据迁移，最后提供数据比对功能验证迁移结果。具体步骤涵盖连接信息配置、表清单获取、json文件生成、数据迁移执行及日志记录，确保数据一致性。相关工具和脚本简化了复杂迁移过程，提升效率。

游客kufrkwrbkmpsa

513 0 0

土木林森

关系型数据库分布式数据库数据库

PolarDB 以其出色的性能和可扩展性，成为大数据分析的重要工具

在数字化时代，企业面对海量数据的挑战，PolarDB 以其出色的性能和可扩展性，成为大数据分析的重要工具。它不仅支持高速数据读写，还通过数据分区、索引优化等策略提升分析效率，适用于电商、金融等多个行业，助力企业精准决策。

土木林森

327 4 4

1941623231718325

机器学习/深度学习搜索推荐大数据

大数据与教育：学生表现分析的工具

【10月更文挑战第31天】在数字化时代，大数据成为改善教育质量的重要工具。本文探讨了大数据在学生表现分析中的应用，介绍学习管理系统、智能评估系统、情感分析技术和学习路径优化等工具，帮助教育者更好地理解学生需求，制定个性化教学策略，提升教学效果。尽管面临数据隐私等挑战，大数据仍为教育创新带来巨大机遇。

1941623231718325

598 2 2

龙大吉

分布式计算大数据 Apache

利用.NET进行大数据处理：Apache Spark与.NET for Apache Spark

【10月更文挑战第15天】随着大数据成为企业决策和技术创新的关键驱动力，Apache Spark作为高效的大数据处理引擎，广受青睐。然而，.NET开发者面临使用Spark的门槛。本文介绍.NET for Apache Spark，展示如何通过C#和F#等.NET语言，结合Spark的强大功能进行大数据处理，简化开发流程并提升效率。示例代码演示了读取CSV文件及统计分析的基本操作，突显了.NET for Apache Spark的易用性和强大功能。

龙大吉

410 1 1

游客jrsavpvegh62y

存储人工智能算法

为什么局域网协作工具是大数据时代的必需品？

本文深入解析了局域网文档协同编辑的技术原理与优势，涵盖分布式系统架构、实时同步技术、操作变换及冲突自由的副本数据类型等核心概念。同时，探讨了其在信息安全要求高的组织、远程与现场混合团队、教育与科研团队等场景的应用，以及国内外技术方案对比和市场未来趋势。

游客jrsavpvegh62y

179 0 0

大数据任务调度工具 Apache DolphinScheduler

大数据任务调度工具 Apache DolphinScheduler

项目亮点

DolphinScheduler 简介

调度系统选型

为什么大数据要选择 DolphinScheduler

DolphinScheduler 的技术栈

云原生

热门文章

最新文章

相关课程

相关电子书

推荐镜像