调度的基石——标签系统随着业务的变化及技术的发展,云上机器的异构性也越来越明显,下面介绍一些典型的例子。 (1)在物理机层面,Intel CPU 不断更新换代,如 Haswell、Broadwell、Skylake、 Caslake 等,同样地,与之对应的机型也有诸多差异,如不同的内存容量、磁盘容量等。
(2)在物理网络和虚拟网络层面,物理网络从早期的千兆网络、万兆网络演变到目前主流的 25G bit/s 网络。同样,虚拟网络也在逐步发展: 从经典网络到 VPC 网络,以及是否支持 DPDK 高速转发等。
(3)存储系统的差异,包括高效云盘、SSD 云盘、ESSD 云盘及本地实例存储的区别。
(4)虚拟化技术,除了大家熟知的 Xen 和 KVM ,还有阿里云特有的神龙架构等。 调度流程中的过滤—权重工作流程,需要区分这些差异,或者说需要把这些差异用程序表达出来。在阿里云的后羿调度系统中,这是由标签系统来实现的。 在系统实现层面,标签系统其实就是为每台物理机维护了很多的 Key-Value 的配对值,如图 3-12 所示,涵盖了从物理机自身的硬件配置、上面运行的软件状态、机器的实际物理位置到售卖相关的业务特性等方方面面的信息。其实,在设计之初,标签系统就并不只是供调度系统使用,我们期望它在物理机的管理控制等方面都能提供系统支撑。 有了标签系统后,无论是调度系统还是管控系统,都能通过程序化的方式感知和比较下层物理机的差异,甚至进一步,通过引入标签组等方式,更快地筛选机器,降低过滤器—权重器—选择器工作流中过滤器的压力。
《弹性计算:无处不在的算力》电子书可以通过以下链接下载:https://developer.aliyun.com/topic/download?id=7996"
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。