混合部署

首页 标签 混合部署
# 混合部署 #
关注
484内容
首次!统一调度系统规模化落地,全面支撑阿里巴巴双 11 全业务
今年双 11 首次规模化亮相的统一调度,通过一套调度协议、一套系统架构,统一管理底层的计算、存储、网络资源,超大规模、高效率、自动化的资源弹性,实现了业界新的突破。在离线混部、离在线混部、新的快上快下技术,减少数万台服务器采购,带来数亿计的资源成本优化和大促效率提升。
阿里云发布企业云原生IT成本治理方案:五大能力加速企业 FinOps 进程
阿里云企业云原生 IT 成本治理方案助力企业落地企业 IT 成本治理的理念、工具与流程,让企业在云原生化的过程中可以数字化地实现企业 IT 成本管理与优化,成为 FinOps 领域的践行者与领先者。
阿里云混合云建管用一体化探索实践 助力政企从容应对数字化转型难题
专有云已从概念走向落地实践。由云计算标准和开源推进委员会举办的“专有云技术主题沙龙”,除对专有云标准体系等进行解读外,还邀请了业内大咖倾情分享,共同探索专有云未来发展趋势。
云原生混部最后一道防线:节点水位线设计
由于混部是一个复杂的技术及运维体系,包括 K8s 调度、OS 隔离、可观测性等等各种技术。今天我们要关注的是混部在单机运行时的最后一道防线——单机水位线设计。
|
9月前
| |
来自: 弹性计算
GPU实例使用--vGPU资源利用率的提升、监控与告警的实现
随着AI计算及云游戏为代表的图形渲染业务的飞速发展,越来越多的企业和个人开始使用GPU实例。同时,由于GPU算力资源成本较高,对于负载相对较小的业务,客户会更倾向于选择使用1/2或者1/4甚至更小的vGPU实例来运行其业务,vGPU技术随之得以迅速发展。
|
5月前
|
国内首个!高通量以太网协议标准正式发布
近日,在CCF全国高性能计算学术年会上,阿里云、中国科学院计算技术研究所等40余家机构举办发布会,联合发布国内首个高通量以太网ETH+协议标准,可实现集合通信性能30%的提升。
惊魂48小时,阿里工程师如何紧急定位线上内存泄露?
云计算场景下的大规模分布式系统中,网络异常、磁盘IO异常、时钟跳变、操作系统异常乃至软件本身可能存在bugs等,均给分布式系统正确运行带来了挑战。持续的监控报警完善是打造稳定高可用分布式系统过程中非常重要的工作,这个也就要求我们研发同学从细节处入手,本文将介绍的场景是针对线上报警的一丝异常,抽丝剥茧找到内存泄露的root cause,全程48小时,跟进修复了潜在风险隐患,并进一步丰富完善监控报警体系的过程。
| |
来自: 数据库
阿里云数据库应用案例3 - PG大客户专属数据库集群
PG大客户专属数据库集群客户特点 ### 特点: 1、客户非常关心IT成本, 2、客户使用的数据库量较大, 3、客户有自己的运维、DBA团队, 4、客户有自己的IT管理体系, ### 挑战与痛点: 1、使用全托管数据库, DBA和运维何去何从? 2、使用全托管数据库, 无法完全匹配客户原有的IT管理体系需求? 3、使用全托管数据库, 全黑盒.
免费试用