机器学习入门|聚类(一)
聚类算法是在没有给定标签和样本值的前提下进行数据划分,是典型的无监督学习(unsupervised learning)算法,简单的介绍了聚类,记录下学习的笔记!
阿里巴巴搜索无状态服务的秒级弹性调度
目前阿里巴巴搜索的分布式服务一般都是基于Hippo+Carbon来调度的,包括部署、扩缩容、名字服务注册。如下图:
以及ApplicationMaster中Application的Job执行时长超过批次时间的监控,来达到对Spark on Yarn程序的失败重启、超时重启等功能
二.
任务调度服务SchedulerX系列之任务调度类型全解析
SchedulerX支持多种类型的分布式任务调度模式,用户的客户端可以单机、集群方式接入SchedulerX系统。SchedulerX就可以根据用户的任务配置,进行多种类型的分布式调度,触发用户定制的业务逻辑,进行业务处理。