深度 | 容器规模化落地企业的最佳途径

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
可观测链路 OpenTelemetry 版,每月50GB免费额度
Serverless 应用引擎免费试用套餐包,4320000 CU,有效期3个月
简介: 作为云原生代表技术之一,容器技术可帮助企业提升 IT 架构的敏捷性,加速应用创新,帮助企业更加灵活地应对商业发展中的不确定性。

头图.png

随着云原生时代的发展,传统 IT 基础设施加速云化,云原生化成为云上的必然趋势。作为云原生代表技术之一,容器技术可帮助企业提升 IT 架构的敏捷性,加速应用创新,帮助企业更加灵活地应对商业发展中的不确定性。疫情期间,在线教育、音视频、公共健康等行业出现了大幅度的增长。一些基于云计算和容器技术的公司,很好地把握住了业务快速增长的机遇,实现了自身的跨越式发展。

容器规模化落地已成为企业发展“必修课”

疫情加速了企业数字化的发展进程,低延时和高并发的线上场景频繁出现在企业日常经营中,业务创新的需求也在倒逼企业不断运用新兴技术手段。现如今,Kubernetes 逐渐成为云原生时代的基础设施,容器技术被广泛应用于人工智能、大数据、区块链、边缘计算等场景,作为轻量化的计算载体,为更多的场景赋予高度的弹性与敏捷性。在日常经营和业务创新的双重压力之下,越来越多的企业从小规模试用到全面拥抱容器规模化落地,以保障企业业务能够健康且长远发展

据信通院《2020 年中国云原生用户调查报告》显示,60% 以上的用户已在生产环境中应用容器技术,近八成用户的生产需求需要 1000 及以上的节点规模满足,超过 13% 的用户容器规模已超过 5000 节点,9% 的用户容器规模大于 10000 节点。随着云原生技术的进一步普及,越来越多的企业核心业务切换到容器,企业生产环境容器集群规模呈现爆发式增长趋势,容器规模化落地已成为企业发展“必修课”。目前开源版本 Kubernetes 最多可以支撑 5 千节点及 15 万 Pod,已经无法满足日益增长的业务需求。

容器规模化落地企业要过哪些难关

大规模容器集群可以提供更大的业务负载能力,更高的流量突发能力,更加高效的集群管理方式。作为云原生领域的实践者和引领者,阿里云率先实现了单集群 1 万节点1百万 Pod 的规模突破,相比于社区版 Kubernetes,单集群节点数在社区基础上提高了 2 倍,Pod 数提升了 6.7 倍。基于服务百万客户的经验,阿里云沉淀了“容器规模化落地四步走”的路径方法,可帮助企业克服容器规模化落地过程中的难关,轻松应对不断增加的规模化需求。

第一步:如何判断自身是否需要容器集群规模化?

当企业面临流量突发型业务、复杂计算型业务、需进一步提高运维效率等业务或 IT 诉求,单集群的容量成为当前掣肘发展的瓶颈。例如基因计算、在线秒杀等业务,会在短时间会产生大量的负载,对单集群能容纳的计算资源提出了严峻的挑战,亟需单个集群能够支持大规模的节点来批量运行 Pod。基于此,企业就要开始考虑集群扩容了,不过追求集群规模大,并不是一针见效的万能“银弹”, 企业需要根据自身业务发展特性,优化集群能力实现业务价值,盲目追求集群规模化将扩大整个故障域的风险

第二步:容器规模化不是简单扩大规模的大小,如何自下而上实现一整套体系优化,打通任督二脉?

Kubernetes 作为云原生时代的操作系统,其自身及其部署的云环境是非常复杂庞大的,因此容器规模化是从底层云资源到上层应用的一整套优化体系。企业用户需要重点解决三个层面的优化:

  1. 在云产品层面打破对云资源配额的限制;
  2. 在集群组件层面提升资源规模化的天花板;
  3. 在 Kubernetes 资源层面优化集群配置策略来保证资源规模化能力。

第三步:容器规模化后难以保障原有性能不受损,如何实现性能进一步提升,做个“灵活的巨人”?

容器集群规模被放大 N 倍之后,对存储、集群网络、应用分发等性能都提出了巨大挑战,例如大规模集群数据中心内网络流量通常较大,网络延迟与抖动的问题也会随之被放大,影响集群网络传输效率和集群稳定。还有大规模集群下批量发布更新应用的常规场景,1w 个节点瞬时的镜像拉取会产生巨大的网络冲击,给镜像服务和网络带宽带来了巨大的压力。容器规模化的初衷是提供更强大的技术支撑力,不仅要保障原有性能,还需要进一步提升整体性能

企业用户可重点从四个方面入手优化:

  • Node&Pod 规模化效率
  • 网络效率(吞吐与延迟)
  • DNS 解析效率
  • 镜像加速

第四步:容器规模化后最惊心动魄的难关是“稳定”

如果说集群规模化是第一步,那么稳定的运行上万节点的集群才是更加惊心动魄的,庞大的系统最重要的就是控制故障域,防止雪崩。相对于规模而言,容器规模化后的稳定性更加重要,因为大规模集群的恢复不是简单的重启就能够解决的,一旦雪崩开始,整体崩溃不可避免,严重影响业务接续性。对于企业而言,大规模集群的稳定性就是业务在线的安全性。企业用户重点需要考虑事前止血预案、资源索引和系统组件优化、以及监控所有节点随时启动自愈流程。

阿里云帮助企业一站式实现容器规模化落地

针对大规模集群在企业落地的种种难关,阿里云基于 ACK Pro 提供了企业级的容器集群管理能力,在 APIServer 和调度器上提供了大量性能优化,打破资源规模限制、提升性能天花板、保证集群稳定性。通过自研高性能容器网络 Terway,优化 Pod 延迟 30%,降低大规模 Service 的性能开销,不仅可解决大规模集群的网络瓶颈问题,而且提供几乎云上原生的网络性能,使得集群响应更迅速。企业级镜像仓库 ACR EE 支持独享存储,提供按需加载镜像的能力,降低启动时间 60%,可解决大规模节点拉取镜像慢的问题。整合阿里云存储、网络和安全能力,阿里云一站式为企业提供容器规模化运行的最佳性能:更加高效的网络转发、更强扩展能力的存储、更高效的应用与镜像分发、更稳定的大规模集群管理

1.png

值得一提的是,阿里云在近日 2020 云原生产业大会中,成为首家通过信通院容器规模化性能测试的云服务商,获得最高级别认证—“卓越”级别。在信通院的容器规模化测评中,阿里云容器服务的满负载压力测试、网络延时、网络性能损耗等多项测评结果,在参与测评的厂商中遥遥领先。 基于此,阿里云拥有足够弹性的“服务能力空间”,可根据企业业务量身定制满足当前所需的容器集群服务,除了支撑阿里集团内部核心系统容器化上云和阿里云的云产品本身,也将多年的大规模容器技术以产品化的能力输出给众多围绕双十一的生态公司和 ISV 公司。通过支撑来自全球各行各业的容器云,阿里云容器服务已经沉淀了支持单元化架构、全球化架构、柔性架构的云原生应用托管中台能力,管理了超过 1 万个以上的容器集群,提供企业级可靠服务。

阿里云拥有国内规模最大的容器集群、最丰富的云原生产品家族和最全面的开源贡献,提供云原生裸金属服务器、云原生数据库、数据仓库、数据湖、容器、微服务、DevOps、Serverless 等超过 100 款创新产品,覆盖新零售、政务、医疗、交通、教育等各个领域。阿里云容器服务是国内唯一连续两次入选 Gartner 2019 年和 2020 年《竞争格局:公共云容器服务》报告的厂商,阿里云覆盖 Serverless Kubernetes、服务网格、容器镜像等九项产品能力,与 AWS 平齐,产品丰富度领先 Google、微软、IBM 和 Oracle 四家厂商。

2.jpg

随着容器技术的逐渐普及,如何评价容器性能高低成为业内普遍关注的议题。针对行业痛点,中国信息通信研究院发布的业内首个超大规模容器性能测评结果,客观真实反映了容器集群组件级的性能表现。在 2020 云原生产业大会 上,阿里云研究员、阿里云原生技术负责人丁宇表示,“阿里云一直致力于推动云原生在国内的普及,将与信通院一起促进中国容器市场的规范化、标准化发展。”

点击链接即可查看容器服务 ACK: https://www.aliyun.com/product/kubernetes

阿里巴巴云原生关注微服务、Serverless、容器、Service Mesh 等技术领域、聚焦云原生流行技术趋势、云原生大规模的落地实践,做最懂云原生开发者的公众号。”

相关实践学习
巧用云服务器ECS制作节日贺卡
本场景带您体验如何在一台CentOS 7操作系统的ECS实例上,通过搭建web服务器,上传源码到web容器,制作节日贺卡网页。
容器应用与集群管理
欢迎来到《容器应用与集群管理》课程,本课程是“云原生容器Clouder认证“系列中的第二阶段。课程将向您介绍与容器集群相关的概念和技术,这些概念和技术可以帮助您了解阿里云容器服务ACK/ACK Serverless的使用。同时,本课程也会向您介绍可以采取的工具、方法和可操作步骤,以帮助您了解如何基于容器服务ACK Serverless构建和管理企业级应用。 学习完本课程后,您将能够: 掌握容器集群、容器编排的基本概念 掌握Kubernetes的基础概念及核心思想 掌握阿里云容器服务ACK/ACK Serverless概念及使用方法 基于容器服务ACK Serverless搭建和管理企业级网站应用
相关文章
|
存储 运维 Kubernetes
国内首个云上容器ATT&CK攻防矩阵发布,阿里云助力企业容器化安全落地
本文对云上容器ATT&CK攻防矩阵做了详细阐述,希望能帮助开发和运维人员了解容器的安全风险和落地安全实践。
13907 1
国内首个云上容器ATT&CK攻防矩阵发布,阿里云助力企业容器化安全落地
|
2月前
|
运维 Kubernetes 调度
阿里云容器服务 ACK One 分布式云容器企业落地实践
3年前的云栖大会,我们发布分布式云容器平台ACK One,随着3年的发展,很高兴看到ACK One在混合云,分布式云领域帮助到越来越多的客户,今天给大家汇报下ACK One 3年来的发展演进,以及如何帮助客户解决分布式领域多云多集群管理的挑战。
阿里云容器服务 ACK One 分布式云容器企业落地实践
|
2月前
|
供应链 安全 Cloud Native
阿里云容器服务助力企业构建云原生软件供应链安全
针对软件供应链的攻击事件在以每年三位数的速度激增,其中三方或开源软件已经成为攻击者关注的重要目标,其攻击方式和技术也在不断演进。通过供应链的传播,一个底层软件包的漏洞的影响范围可以波及世界。企业亟需更加标准和完善的供应链风险洞察和防护机制。本文将结合最佳实践的形式,面向容器应用完整的生命周期展示如何基于容器服务ACK/ACR/ASM助力企业构建云原生软件供应链安全。
|
2月前
|
运维 Cloud Native Devops
云原生架构的崛起与实践云原生架构是一种通过容器化、微服务和DevOps等技术手段,帮助应用系统实现敏捷部署、弹性扩展和高效运维的技术理念。本文将探讨云原生的概念、核心技术以及其在企业中的应用实践,揭示云原生如何成为现代软件开发和运营的主流方式。##
云原生架构是现代IT领域的一场革命,它依托于容器化、微服务和DevOps等核心技术,旨在解决传统架构在应对复杂业务需求时的不足。通过采用云原生方法,企业可以实现敏捷部署、弹性扩展和高效运维,从而大幅提升开发效率和系统可靠性。本文详细阐述了云原生的核心概念、主要技术和实际应用案例,并探讨了企业在实施云原生过程中的挑战与解决方案。无论是正在转型的传统企业,还是寻求创新的互联网企业,云原生都提供了一条实现高效能、高灵活性和高可靠性的技术路径。 ##
143 3
|
Cloud Native Docker 容器
【云原生】一文秒会Docker容器企业化管理
【云原生】一文秒会Docker容器企业化管理
60 0
【云原生】一文秒会Docker容器企业化管理
|
监控 Cloud Native Serverless
云原生容器Clouder认证:容器应用与集群管理—课时5:如何搭建企业网络应用
云原生容器Clouder认证:容器应用与集群管理—课时5:如何搭建企业网络应用
|
弹性计算 运维 Prometheus
《云原生架构容器&微服务优秀案例集》——03 零售/电商——餐道 基于 ACK 构建创新底座,加速 SaaS 规模化演进
《云原生架构容器&微服务优秀案例集》——03 零售/电商——餐道 基于 ACK 构建创新底座,加速 SaaS 规模化演进
198 0
|
容器
《容器加速企业创新阿里云容器服务》电子版地址
容器加速企业创新阿里云容器服务
103 0
《容器加速企业创新阿里云容器服务》电子版地址
|
容器