阿里云容器服务,全面助力云上体育盛会

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
简介: 本文讲述了阿里云容器服务,通过安全稳定的产品能力和成熟的稳定性保障体系,全面助力云上体育赛场,促进科技之光与五环之光交相辉映。

【阅读原文】戳:阿里云容器服务,全面助力云上体育盛会


引言

 


 

巴黎奥运会从7月27日开幕,到8月12日闭幕,全球峰值观看人数规模在40亿左右,阿里云作为奥运会官方云服务商,成功支撑了这次世界范围内的超大规模电视及网络转播。

 

巴黎奥运会是云计算替代卫星成为主要转播方式的首届奥运会,是1964年奥运会实现卫星电视直播以来的又一重大进步。今年,超过三分之二的奥运电视及网络直播信号基于阿里云向全球分发,是巴黎奥运会走向世界的基础,这是奥运迈入数字时代的重要里程碑[1]

 

在这次赛事的多个核心项目中,阿里云原生技术发挥了重要的支撑作用,如容器服务Kubernetes版ACK、容器镜像服务ACR等通过高效稳定、极致弹性、安全智能等能力的输出 ,再次推动国际体育赛事以云原生的方式加速向数字化演进发展。

 

容器服务Kubernetes版ACK整合了阿里云的计算、存储、网络和安全能力,提供高性能且可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理,助力企业高效运行云端Kubernetes容器化应用。正如体育精神体现出的进步与超越一样,阿里云容器服务也在不断向极致努力,阿里云容器服务ACK是Gartner容器管理魔力象限报告中亚洲唯一的全球领导者(2023),国内唯一进入Forrester领导者象限的产品(2022)。

 

容器镜像服务ACR作为云原生领域重要的制品资产管理平台,为企业提供云原生制品安全托管与高效分发能力,加速企业的云原生化迭代创新。容器镜像服务ACR作为云原生领域重要的制品资产管理平台,为企业提供云原生制品安全托管与高效分发能力,加速企业的云原生化迭代创新。

 

在这次全球瞩目的体育盛会服务保障中,容器服务专业版ACK Pro,容器镜像服务企业版ACR EE,都凭借出色的发挥,为更多上层的项目应用构建和运行提供强大的能力基座,更向世界证明了来自中国的云原生基石能力。下面让我们一起回顾阿里云容器服务是如何助力精彩体育赛事的。

 

 

 


“子弹时间”特效,让精彩定格在每一个瞬间


 

 

巴黎奥运会采用中国阿里云AI增强的全新转播技术——多镜头回放系统。该系统让转播有了科幻电影般的视觉效果,给观众呈现强化慢镜头、时间静止等特效画面,被称为“子弹时间”。OBS在包括战神广场、协和广场等在内的14个比赛场馆布置启用了这套系统,涵盖七人制橄榄球、羽毛球、体操田径、篮球、沙滩排球、乒乓球、摔跤、网球、柔道、霹雳舞、小轮车自由式和滑板等21个项目 [2]

 

超强的“子弹时间”是怎么做到的?巴黎奥运会“子弹时间”特效由阿里云提供AI技术支持。其基本工作原理是:多个镜头采集到图像后发送到云端,由阿里云AI算力完成实时空间重建和3D渲染,选定瞬间作为回放内容。只需数秒即可在云端生成,并无缝融入赛事直播,分发至全世界[3]。如此高效的实时处理底层正是阿里云云转播基于ACK Pro集群对GPU节点的高效管理而产生的强大AI算力。ACK Pro集群配合ACK云原生AI套件,可以高效支持异构资源统一管理、AI任务调度、弹性调度、AI作业生命周期管理、AI数据编排与加速,持续优化异构资源效率,高效运行AI等异构工作负载。

 

 

 

 


稳如磐石,为赛事官网保驾护航

 


 

奥运会官网是赛事信息最权威、最实时的发布平台,基于阿里云容器服务ACK Pro在法兰克福、伦敦等地区构建的异地双活的高可用架构,奥运会官网在赛事期间持续面向全球观众提供了稳定、可靠、安全、高性能的访问服务。

 

 

另外,容器技术的DevOps快速部署能力也在自动媒体标注场景中被应用,来整合各种来源的数据,例如运动员入场时间、进球时间等,建立数据库,并通过人工智能来丰富OBS的视频图片相关的元数据。该项目同样基于ACK Pro进行部署和构建,提高媒体标注自动化程度。

 

 

 


 

阿里云容器服务核心技术能力


 

 

阿里云容器服务提供了业界具有竞争力的容器产品,连续多年保持国内容器市场头部份额。除了本次赛事的支持,也是在双十一、618、春晚等大型活动的中坚力量,支撑了集团核心电商、零售云的聚石塔、物流云的菜鸟CPAAS、中间件的MSE、边缘云的CDN和ENS,也支持了AI大模型通义千问、数据库的云原生化和钉钉音视频云原生化,沉淀了丰富的核心技术竞争力。

 

图丨阿里云容器服务产品线的整体架构

 

 

 

1. 全球化架构

 

 

阿里云容器服务在全球34个地域开通服务,覆盖中国、亚太、北美和欧洲,真正做到了全球化部署、内置最佳高可用实践和容灾备份解决方案,非常适合全球性业务架构的场景,可以帮助客户显著提升系统可用性和稳定性。针对奥运会这种对于可靠性和SLA要求极高的场景,客户基于ACK Pro和ACR企业版部署了多组跨大洲级别的容器集群,覆盖法兰克福、伦敦、东京、新加坡等地域,做到了全程0故障,稳定性表现令人满意。

 

 

 

2. 企业级支撑


 

阿里云容器服务ACK(Alibaba Cloud Container Service for Kubernetes)是全球首批通过Kubernetes一致性认证的服务平台,提供高性能的容器应用管理服务,支持企业级Kubernetes容器化应用的生命周期管理。作为国内云计算容器平台的领军者,从2015年上线后,一路伴随并支撑各行业的客户发展。

 

ACK的Pro托管版集群支持赔付标准的SLA,适合生产环境下有着大规模业务,对稳定性和安全性有高要求的企业客户。

 

更可靠的托管控制面:稳定支撑大规模集群的管控;etcd容灾和备份恢复,冷热备机制最大程度保障集群数据库的可用性;管控组件的关键指标可观测,助力您更好地预知风险。

 

更安全的容器集群:管控面etcd默认采用加密盘存储;数据面通过选择安装kms-plugin组件实现Secrets数据落盘加密。开放安全管理,并提供针对运行中容器更强检测和自动修复能力的安全管理高级版。

 

更智能的容器调度:集成更强调度性能的Kube Scheduler,支持多种智能调度算法,优化在大规模数据计算、高性能数据处理等业务场景下的容器调度能力。

 

SLA保障:提供赔付标准的SLA保障,集群API Server的可用性达到99.95%。

 

阿里云容器镜像服务ACR(Alibaba Cloud Container Registry)是面向容器镜像等云原生应用制品的安全托管及高效分发平台。ACR支持全球同步加速、大规模和AI大镜像分发加速等全链路加速能力,与容器服务ACK无缝集成,帮助企业降低交付复杂度、提升交付效率,合力打造云原生应用一站式解决方案。

 

新支持OCI v1.1规范:支持标准化管理多架构容器镜像、Helm Chart等云原生应用制品;支持标准化使用全球同步、加签验签等产品能力;支持软件供应安全生态工具标准化对接。

 

新优化AI场景分发加速:按需加速能力升级,降低 70%加速镜像就绪耗时;P2P分发加速能力升级,相较于旧版性能提升50%,支持和按需加速组合使用,提升AI大镜像大规模场景分发效率。

 

新升级供应链安全能力:支持云原生应用可信交付,交付链路可观测、可审计;支持基于策略的自动阻断,实现一次应用变更,全球化自动化交付,提升应用交付效率及安全性。

 

 


 

3. 稳定性保障体系

 


 

容器服务ACK支撑了数万国内最多的K8s集群,高效稳定的海量集群管理至关重要。ACK使用了如下手段建设稳定性保障体系。

 

 

 

一体化运维


 

 

ACK的统一运维平台集成了全网集群的监控、告警、日志、巡检、元数据管理、资产管理等功能,可以实时观测、管理全网34个地域的任何集群。例如,如果用户K8s集群的master组件异常、系统组件异常、异常事件,都可以在运维平台上观察到并自动触发告警。高效的运维管理平台,支撑ACK管理了全网数万集群和数十万节点,提升了全网的稳定性。ACK还将内部运维能力产品化,对用户输出托管节点池及其自动化运维能力,帮助用户自动化升级集群、升级组件、CVE修复、节点自愈等,显著降低了客户运维集群的复杂度,进一步提升了集群的安全性和稳定性。

 

 

 

全场景AI诊断


 

ACK提供了容器自治服务CIS以及AI助手,可以让用户对集群进行覆盖网络、节点、组件、业务等进行集群运行的核心点,进行深入检查和诊断,充分发挥大模型的优势,为用户提供专业的检查诊断能力和友好的使用体验,显著提升了用户管理集群的能力。容器服务ACK AI助手是阿里云容器服务团队提供的基于大模型的新型助手功能。基于阿里云容器服务团队在Kubernetes和云原生领域积累的知识经验、阿里云容器服务运维体系的观测以及ACK技术专家的诊断经验,ACK AI助手为您提供阿里云容器服务和Kubernetes相关的、大模型增强的智能问答和智能诊断。实践中,用户可以警示对自己的集群和业务做巡检并生成检查报告,ACK让用户不只是部署并使用Kubernetes,更重要的是通过产品能力专业赋能用户、提升用户对Kubernetes的使用深度和体验。

 

 

 

全方位保障预案体系


 

针对奥运会活动,容器服务基于已有的保障流程,针对性的制定了全程保障方案,包括提前预案、应急预案、故障演练、值班排期等等。容器服务有丰富的保障经验,每年例行的保障活动包括每年的双十一、618、春节等,这些大型活动的保障活动复杂而全面,容器服务每年在这些活动的过程中取得了近乎0故障的佳绩。

 

除了上述重大保障活动,容器服务内部有常态化的基于混沌的故障演练和突袭,混沌系统随机注入故障,容器团队值班人员会收到告警并根据预案系统中的预案,立即进行处理;经过常态化的训练,团队的应急处理能力锤炼得成熟默契,可以很好的实现1-5-10(1分钟内发出警报、5分钟内定位故障、10分钟内修复故障)的目标和方法论。这些经过实战反复打磨的保障体系,运用到了奥运会保障专项中,有力保障和支持的奥运会的稳定顺利运行。

 

 

 

展望

 

 

在本次备受全球关注的体育盛会中,阿里云容器服务深度参与到赛事项目和活动中,稳如磐石地承担了云转播及“子弹时间”特效、赛事官网等核心项目,为全球带来了时代前沿的云原生技术、产品和服务,与阿里云各个产品线通力协作成功完成“云上体育盛会”。

 

未来,容器服务也会提供服务保障,阿里云一直在构建高效、安全、智能、无界的容器技术能力和稳如磐石的服务品质,促进科技之光与五环之光交相辉映,帮助全球更多行业、企业在云原生的广阔天地里纵横驰骋。

 

引用:

 

[1] 中国经济新闻网  

https://www.cet.com.cn/wzsy/ycxw/10091497.shtml

 

[2] 新华社

http://www.news.cn/digital/20240726/ab8468fcc6774c5b94fd87548fa7d450/c.html

 

[3] 潮新闻

https://tidenews.com.cn/news.html?id=2863786


我们是阿里巴巴云计算和大数据技术幕后的核心技术输出者。

欢迎关注 “阿里云基础设施”同名微信微博知乎

获取关于我们的更多信息~


相关实践学习
通过容器镜像仓库与容器服务快速部署spring-hello应用
本教程主要讲述如何将本地Java代码程序上传并在云端以容器化的构建、传输和运行。
Kubernetes极速入门
Kubernetes(K8S)是Google在2014年发布的一个开源项目,用于自动化容器化应用程序的部署、扩展和管理。Kubernetes通常结合docker容器工作,并且整合多个运行着docker容器的主机集群。 本课程从Kubernetes的简介、功能、架构,集群的概念、工具及部署等各个方面进行了详细的讲解及展示,通过对本课程的学习,可以对Kubernetes有一个较为全面的认识,并初步掌握Kubernetes相关的安装部署及使用技巧。本课程由黑马程序员提供。   相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
18天前
|
供应链 安全 Cloud Native
阿里云飞天企业版获【可信云·容器平台安全能力】先进级认证
阿里云飞天企业版容器系列产品获中国信息通信研究院【可信云·容器平台安全能力】先进级认证,这是飞天企业版容器产品获得《等保四级PaaS平台》和《 云原生安全配置基线规范V2.0》之后,本年度再一次获得行业权威认可,证明飞天企业版的容器解决方案具备符合行业标准的最高等级容器安全能力。
阿里云飞天企业版获【可信云·容器平台安全能力】先进级认证
|
22天前
|
人工智能 运维 Kubernetes
阿里云容器服务AI助手2.0 - 新一代容器智能运维能力
2024年11月,阿里云容器服务团队进一步深度融合现有运维可观测体系,在场景上覆盖了K8s用户的全生命周期,正式推出升级版AI助手2.0,旨在更好地为用户使用和运维K8S保驾护航。
|
1月前
|
人工智能 运维 监控
阿里云ACK容器服务生产级可观测体系建设实践
本文整理自2024云栖大会冯诗淳(花名:行疾)的演讲,介绍了阿里云容器服务团队在生产级可观测体系建设方面的实践。冯诗淳详细阐述了容器化架构带来的挑战及解决方案,强调了可观测性对于构建稳健运维体系的重要性。文中提到,阿里云作为亚洲唯一蝉联全球领导者的容器管理平台,其可观测能力在多项关键评测中表现优异,支持AI、容器网络、存储等多个场景的高级容器可观测能力。此外,还介绍了阿里云容器服务在多云管理、成本优化等方面的最新进展,以及即将推出的ACK AI助手2.0,旨在通过智能引擎和专家诊断经验,简化异常数据查找,缩短故障响应时间。
阿里云ACK容器服务生产级可观测体系建设实践
|
27天前
|
Prometheus Kubernetes 监控
OpenAI故障复盘 - 阿里云容器服务与可观测产品如何保障大规模K8s集群稳定性
聚焦近日OpenAI的大规模K8s集群故障,介绍阿里云容器服务与可观测团队在大规模K8s场景下我们的建设与沉淀。以及分享对类似故障问题的应对方案:包括在K8s和Prometheus的高可用架构设计方面、事前事后的稳定性保障体系方面。
|
19天前
|
监控 安全 Cloud Native
阿里云容器服务&云安全中心团队荣获信通院“云原生安全标杆案例”奖
2024年12月24日,阿里云容器服务团队与云安全中心团队获得中国信息通信研究院「云原生安全标杆案例」奖。
|
1月前
|
人工智能 Cloud Native 调度
阿里云容器服务在AI智算场景的创新与实践
本文源自张凯在2024云栖大会的演讲,介绍了阿里云容器服务在AI智算领域的创新与实践。从2018年推出首个开源GPU容器共享调度方案至今,阿里云容器服务不断推进云原生AI的发展,包括增强GPU可观测性、实现多集群跨地域统一调度、优化大模型推理引擎部署、提供灵活的弹性伸缩策略等,旨在为客户提供高效、低成本的云原生AI解决方案。
|
1月前
|
人工智能 运维 Kubernetes
拥抱智算时代:阿里云容器服务智能、托管、弹性新体验
本文总结了2024云栖大会容器计算专场的演讲内容,重点介绍了阿里云容器服务的新产品体验,包括智能、托管、弹性的特点,以及如何助力客户拥抱智算时代。文中还分享了多项实际案例和技术细节,展示了阿里云容器服务在提升用户体验和解决实际问题方面的努力。
|
1月前
|
供应链 安全 Cloud Native
阿里云容器服务助力企业构建云原生软件供应链安全
本文基于2024云栖大会演讲,探讨了软件供应链攻击的快速增长趋势及对企业安全的挑战。文中介绍了如何利用阿里云容器服务ACK、ACR和ASM构建云原生软件供应链安全,涵盖容器镜像的可信生产、管理和分发,以及服务网格ASM实现应用无感的零信任安全,确保企业在软件开发和部署过程中的安全性。
|
1月前
|
人工智能 Kubernetes Cloud Native
阿里云容器服务,智算时代云原生操作系统
2024云栖大会,阿里巴巴研究员易立分享了阿里云容器服务的最新进展。容器技术已成为云原生操作系统的基石,支持多样化的应用场景,如自动驾驶、AI训练等。阿里云容器服务覆盖公共云、边缘云、IDC,提供统一的基础设施,助力客户实现数字化转型和技术创新。今年,阿里云在弹性计算、网络优化、存储解决方案等方面进行了多项重要升级,进一步提升了性能和可靠性。
|
1月前
|
运维 Kubernetes 调度
阿里云容器服务 ACK One 分布式云容器企业落地实践
阿里云容器服务ACK提供强大的产品能力,支持弹性、调度、可观测、成本治理和安全合规。针对拥有IDC或三方资源的企业,ACK One分布式云容器平台能够有效解决资源管理、多云多集群管理及边缘计算等挑战,实现云上云下统一管理,提升业务效率与稳定性。

热门文章

最新文章