带你读《2022龙蜥社区全景白皮书》——5.3.2 资源隔离技术

本文涉及的产品
服务治理 MSE Sentinel/OpenSergo,Agent数量 不受限
云原生网关 MSE Higress,422元/月
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
简介: 带你读《2022龙蜥社区全景白皮书》——5.3.2 资源隔离技术

5.3.2 资源隔离技术


技术方案简介


混部就是将不同类型的业务在同一台机器上混合部署起来,让它们共享机器上的CPU、内存、IO等资源,目的就是最大限度地提高 资源利用率,从而降低采购和运营等成本。混部通常是将不同优先级的任务混合在一起,例如高优先的实时任务(对时延敏感,资源 消耗低;称为在线)和低优先级批处理任务(对时延不敏感,资源消耗高;称为离线),当高优先级业务需要资源时,低优先级任务需 要立即归还,并且低优先级任务的运行不能对高优先级任务造成明显干扰。


为了满足混部的需求,在单机维度的内核资源隔离技术是最为关键的一项技术,龙蜥云内核在资源隔离的技术上深耕多年,并且在 行业中处于领先地位,这些内核资源隔离技术主要涉及内核中的调度、内存和IO这三大子系统,并且在各个子系统领域根据云原生 的混部场景进行了深入的改造和优化,关键优化包括但不限于:cpu group identity技术,SMT expeller技术,基于cgroup的内存 异步回收技术等。这些关键的技术使客户有能力在云原生混部场景中根据业务特点给出最优解决方案,可有效提高用户的资源使用 率并最终降低用户资源的使用成本,非常适用于容器云混部场景,同时也是大规模化混合部署方案所强依赖的关键技术。


image.png


规模化部署和收益


目前龙蜥OS的资源隔离技术已经在手机制造企业、互联网企业、大型国企,以及阿里云、蚂蚁集团内部规模化应用。从以往众多用 户的部署经验来看,在保障客户的QoS的前提下CPU的使用率可以达到30%~50%,比如龙蜥和 Koordinator 开源混部技术带来的红 利,帮助阿里巴巴实现规模超千万核的云原生混部,混部CPU利用率超50%,帮助2021年“双11”计算成本下降50%,为客户降本 增效提供了良好的技术保障和售后服务。


技术竞争力


目前龙蜥社区的资源隔离方案,不仅仅在互联网、云计算场景得到规模化的应用,近年也在一些知名企业的私有云场景得到广泛应 用。并且,这一开源方案会持续在社区演进,形成最佳云原生实践,作为企业降本增效的重要手段之一,继续服务企业私有云建 设,以及阿里云的客户。龙蜥在资源隔离这块不管从源码透明度,还是从技术的深度,以及场景的广度都是用户第一选择。





相关实践学习
CentOS 7迁移Anolis OS 7
龙蜥操作系统Anolis OS的体验。Anolis OS 7生态上和依赖管理上保持跟CentOS 7.x兼容,一键式迁移脚本centos2anolis.py。本文为您介绍如何通过AOMS迁移工具实现CentOS 7.x到Anolis OS 7的迁移。
相关文章
|
20小时前
|
云安全 运维 监控
带你读《阿里云安全白皮书》(七)——云上安全重要支柱
阿里云秉持“多层防护、全面覆盖”理念,深入贯彻DevSecOps,将安全工具和流程无缝集成至产品研发各阶段,确保安全效果不依赖单一环节。通过威胁建模、安全编码插件、自动化漏洞扫描等手段,前置风险发现,提升安全治理效率。
|
20小时前
|
云安全 监控 安全
带你读《阿里云安全白皮书》(八)——云上安全重要支柱(2)
阿里云在其产品全生命周期中高度重视安全,特别是在设计环节,安全团队会进行全面的威胁建模和安全架构设计,确保产品在部署、网络、应用等各层面的安全性。阿里云具备一票否决权,确保所有产品在上线前都经过严格的安全审核。针对租户隔离问题,阿里云在虚拟化、网络、网关、应用和主机等多个层级实施了纵深防御体系,确保云环境的安全。
|
20小时前
|
云安全 运维 监控
带你读《阿里云安全白皮书》(九)——云上安全重要支柱(3)
阿里云安全白皮书(2024版)介绍了产品全生命周期的安全流程。在编码环节,严格遵守安全编码规范,使用安全SDK和IDE插件,安装IAST灰盒插桩程序,确保业务安全。测试环节通过自研黑、白、灰盒扫描工具进行全面检测。发布前进行默认配置检测和敏感信息检测,确保产品安全上线。运维与监控环节则通过零信任架构、日常运维和应急响应,确保产品持续安全。点击链接下载完整版内容。
|
19小时前
|
云安全 监控 供应链
带你读《阿里云安全白皮书》(十)——云上安全重要支柱(4)
阿里云安全白皮书(2024版)介绍了零信任体系,通过全链路可信身份传递、多层纵深防御和持续监控,实现动态安全。同时,推出“安全分”机制,量化评估产品线的安全水平,提升安全管理效率。点击下载完整版内容。
|
缓存 Kubernetes Cloud Native
带你读《2022龙蜥社区全景白皮书》——6.1.3 资源混部场景的内核隔离实现方案(上)
带你读《2022龙蜥社区全景白皮书》——6.1.3 资源混部场景的内核隔离实现方案(上)
193 6
|
运维 Cloud Native 安全
带你读《2022龙蜥社区全景白皮书》——5.6.2 云原生场景下的计算核心RunD
带你读《2022龙蜥社区全景白皮书》——5.6.2 云原生场景下的计算核心RunD
175 8
|
安全 Cloud Native Java
带你读《2022龙蜥社区全景白皮书》——5.7.1 机密计算平台技术
带你读《2022龙蜥社区全景白皮书》——5.7.1 机密计算平台技术
193 4
|
资源调度 运维 监控
带你读《2022龙蜥社区全景白皮书》——6.1.3 资源混部场景的内核隔离实现方案(下)
带你读《2022龙蜥社区全景白皮书》——6.1.3 资源混部场景的内核隔离实现方案(下)
279 5
|
Rust JavaScript 前端开发
带你读《2022龙蜥社区全景白皮书》——5.1.3 龙芯自主指令级的支持
带你读《2022龙蜥社区全景白皮书》——5.1.3 龙芯自主指令级的支持
174 4
|
测试技术 Shell Anolis
带你读《2022龙蜥社区全景白皮书》——5.10.4 ancert:硬件兼容性验证与守护
带你读《2022龙蜥社区全景白皮书》——5.10.4 ancert:硬件兼容性验证与守护
121 1