阿里云分布式任务调度SchedulerX2.0正式商业化

本文涉及的产品
日志服务 SLS,月写入数据量 50GB 1个月
简介: Schedulerx2.0在公有云公测2年,服务超过1000家公司,积累了丰富的经验,稳定性也得到了足够的验证。为了提供更优质的服务,于2021.9.1正式商业化,同时也会带来更加强大的能力

前言

Schedulerx2.0是阿里中间件自研的基于Akka架构的新一代分布式任务调度平台,提供定时、任务编排、分布式跑批等功能,具有高可靠、海量任务、秒级调度等能力。

Schedulerx2.0在公有云公测2年,服务超过1000家公司,积累了丰富的经验,稳定性也得到了足够的验证。为了提供更优质的服务,于2021.9.1正式商业化,同时也会带来更加强大的能力。



强大功能

定时调度

Crontab

  • 支持可视化的crontab表达式
  • 支持时间偏移,可以通过数据时间做跨天的业务
  • 支持时区,可以做国际化的定时任务


Fixed rate

众所周知,crontab必须被60整除,比如想每隔40分钟跑一次,cron不支持。Fixed rate专门用来做定期轮询,表达式简单。


秒级别调度

通过second_delay表达式可以支持秒级别调度,适合不停执行的实时业务,业务不能中断。

任务编排

schedulerx2.0支持工作流(DAG)进行任务编排,操作简单,前端直拖拖拽拽即可。详细的任务状态图能一目了然看到下游任务为什么没跑,如下图:


schedulerx2.0的工作流还支持上下游数据传递


轻量级分布式编程模型

支持单机、广播、分片、MapReduce多种分布式执行模型。

  • 单机模型:业务多节点部署时,保证不重复执行。
  • 广播模型:所有节点都执行同一逻辑,全部执行完还可以由一台机器回调一次postProcess方法,常用在批量运维,批量清理日志、缓存。
  • 分片模型:支持类似elastic-job的分片模型,常用在分库分表的跑批。
  • MapReduce模型:Schedulerx2.0自创的轻量级分布式编程模型,只需要实现map和reduce方法,就可以将海量数据分布式到多台机器运行,相对于传统大数据跑批:
  • 成本低:直接复用在线应用的机器,不需要额外计算资源
  • 速度快:不需要数据导入导出,直接跑批线上数据库、oss等,可以作为实时业务的跑批
  • 学习简单:不需要大数据的知识,会java就行
  • 可以处理负责的业务:在线业务处理往往逻辑很复杂,传统大数据跑批sql无法满足,使用java高级语言可以处理复杂逻辑,还可以直接复用业务接口。


多语言

除了java语言,schedulerx还支持多种语言的任务类型


其中http任务是serverless,不需要注册客户端就能执行。Schedulerx的http任务支持签名认证,防止用户的http接口被恶意攻击。

丰富的任务运维能力

  • 支持对堵塞任务的手动停止、超时自动停止。
  • 支持对失败任务的原地重跑、标记成功。
  • 支持重刷数据:通过数据时间+重刷数据,可以重刷历史上的数据,把漏跑的任务重新执行。

商业化报警

  1. 报警通道支持短信、钉钉机器人、邮件

  1. 报警类型支持失败报警、超时报警、无可用机器报警等


  1. 每个任务都可以单独配置报警联系人,也可以使用应用的报警联系人组


全新的权限体系

本次商业化带来了全新的权限体系,支持阿里云RAM权限,支持读写等细粒度权限控制。



新增站点

本次商业化,新增了香港、新加坡、德国、美国、日本站点。

用户有其他站点的需求,可以提工单给我们,我们会尽量满足。


未来规划

日志收集

收集客户端的任务调度日志,甚至是应用日志,可以直接在控制台看到日志,分析任务失败的原因。


弹性扩缩容

离线任务分布式跑批的时候,可以动态扩容机器加快处理速度。跑批结束,可以缩容,节省机器成本。


一次性任务

一个任务只在未来某个时刻点执行一次,执行完自动销毁。

相关实践学习
日志服务之使用Nginx模式采集日志
本文介绍如何通过日志服务控制台创建Nginx模式的Logtail配置快速采集Nginx日志并进行多维度分析。
目录
相关文章
|
6天前
|
机器学习/深度学习 分布式计算 数据挖掘
MaxFrame 性能评测:阿里云MaxCompute上的分布式Pandas引擎
MaxFrame是一款兼容Pandas API的分布式数据分析工具,基于MaxCompute平台,极大提升了大规模数据处理效率。其核心优势在于结合了Pandas的易用性和MaxCompute的分布式计算能力,无需学习新编程模型即可处理海量数据。性能测试显示,在涉及`groupby`和`merge`等复杂操作时,MaxFrame相比本地Pandas有显著性能提升,最高可达9倍。适用于大规模数据分析、数据清洗、预处理及机器学习特征工程等场景。尽管存在网络延迟和资源消耗等问题,MaxFrame仍是处理TB级甚至PB级数据的理想选择。
29 4
|
14天前
|
分布式计算 大数据 数据处理
技术评测:MaxCompute MaxFrame——阿里云自研分布式计算框架的Python编程接口
随着大数据和人工智能技术的发展,数据处理的需求日益增长。阿里云推出的MaxCompute MaxFrame(简称“MaxFrame”)是一个专为Python开发者设计的分布式计算框架,它不仅支持Python编程接口,还能直接利用MaxCompute的云原生大数据计算资源和服务。本文将通过一系列最佳实践测评,探讨MaxFrame在分布式Pandas处理以及大语言模型数据处理场景中的表现,并分析其在实际工作中的应用潜力。
49 2
|
22天前
|
运维 Kubernetes 调度
阿里云容器服务 ACK One 分布式云容器企业落地实践
阿里云容器服务ACK提供强大的产品能力,支持弹性、调度、可观测、成本治理和安全合规。针对拥有IDC或三方资源的企业,ACK One分布式云容器平台能够有效解决资源管理、多云多集群管理及边缘计算等挑战,实现云上云下统一管理,提升业务效率与稳定性。
|
2月前
|
分布式计算 Java 开发工具
阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
本文介绍了XGBoost在MaxCompute+OSS架构下模型持久化遇到的问题及其解决方案。首先简要介绍了XGBoost的特点和应用场景,随后详细描述了客户在将XGBoost on Spark任务从HDFS迁移到OSS时遇到的异常情况。通过分析异常堆栈和源代码,发现使用的`nativeBooster.saveModel`方法不支持OSS路径,而使用`write.overwrite().save`方法则能成功保存模型。最后提供了完整的Scala代码示例、Maven配置和提交命令,帮助用户顺利迁移模型存储路径。
|
4月前
|
运维 Kubernetes 调度
阿里云容器服务 ACK One 分布式云容器企业落地实践
3年前的云栖大会,我们发布分布式云容器平台ACK One,随着3年的发展,很高兴看到ACK One在混合云,分布式云领域帮助到越来越多的客户,今天给大家汇报下ACK One 3年来的发展演进,以及如何帮助客户解决分布式领域多云多集群管理的挑战。
阿里云容器服务 ACK One 分布式云容器企业落地实践
|
3月前
|
存储 边缘计算 城市大脑
阿里云入选Gartner®分布式混合基础设施魔力象限
Gartner正式发布了《分布式混合基础设施魔力象限》(Magic Quadrant™ for Distributed Hybrid Infrastructure),阿里云在入选的中国厂商中于执行能力(纵轴)和愿景完整性(横轴)上均处在最高、最远的位置。
|
4月前
|
数据采集 分布式计算 MaxCompute
MaxCompute 分布式计算框架 MaxFrame 服务正式商业化公告
MaxCompute 分布式计算框架 MaxFrame 服务于北京时间2024年09月27日正式商业化!
109 3
|
3月前
|
存储 边缘计算 城市大脑
阿里云入选Gartner®分布式混合基础设施魔力象限
Gartner正式发布了《分布式混合基础设施魔力象限》(Magic Quadrant™ for Distributed Hybrid Infrastructure),全球共9家厂商入围,阿里云成功入选,位居利基者(Niche Players)象限。
|
4月前
|
人工智能 Kubernetes Cloud Native
深度对话 解锁阿里云分布式云原生技术落地新姿势
深度对话 解锁阿里云分布式云原生技术落地新姿势
深度对话 解锁阿里云分布式云原生技术落地新姿势
|
4月前
|
存储 运维 应用服务中间件
阿里云分布式存储应用示例
通过阿里云EDAS,您可以轻松部署与管理微服务应用。创建应用时,使用`CreateApplication`接口基于模板生成新应用,并获得包含应用ID在内的成功响应。随后,利用`DeployApplication`接口将应用部署至云端,返回"Success"确认部署成功。当业务调整需下线应用时,调用`ReleaseApplication`接口释放资源。阿里云EDAS简化了应用全生命周期管理,提升了运维效率与可靠性。[相关链接]提供了详细的操作与返回参数说明。