《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.2 游戏容器化部署最佳实践(5)

本文涉及的产品
容器镜像服务 ACR,镜像仓库100个 不限时长
日志服务 SLS,月写入数据量 50GB 1个月
简介: 《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.2 游戏容器化部署最佳实践(5)

《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.2 游戏容器化部署最佳实践(4) https://developer.aliyun.com/article/1231998?groupCode=supportservice



4. 设置合理的资源请求和限制


理想情况下,业务应该根据实际情况,设置合理的Resource1Request和

Limit。Request用于对资源的占位,表示容器至少可以获得的资源; Limit用于对资源的限制,表示容器至多可以获得的资源。这样的设置有利于容器的健康运行,资源的充分使用,并且能够评估出资源的总量。


如果容器的Resource Request和Limit设置得很高,但是实际业务用不到,那么就会造成资源的不合理分配和浪费。建议使用资源配额(Resource1Quota)划分资源,使用Limit Range限制资源,以及智能Request推荐功能。


•动态调度提升资源利用率

节点亲和性


若某个计算密集型任务,被调度到内存密集型的节点上,导致内存密集型的

CPU被占满,但内存几乎没怎么用,会造成较大的资源浪费,同样,如果是一个内存占用型的任务,被调度到小内存的节点上,可能会频繁触发OOM。可以通过节点池设置一个Label标记,标记该类节点池是CPU密集型或者内存占用型,随后在创建业务负载时也设置一个标记,标明这个负载需要在对应的节点类型上运行。


Kubernetes的调度器会将这个负载调度到合适的节点上,这种寻找最合适的节

点的方式,可以有效提升资源利用率,十分方便和高效。


负载感知调度

原生的Kubernetes调度策略倾向于调度Pod到节点剩余资源较多的节点上,比

如默认的LeastRequestedPriority策略。但是原生调度策略的资源分配是静态的,而且初始设置的Request不能代表任务真实资源的使用情况,因此当业务负载降低时,Kubernetes调度器的可用资源与集群的实际闲置资源会有较大偏差。如果调度器可以基于节点的实际资源利用率进行调度,将一定程度上解决资源浪费的问题。


负载感知调度是ACK基于Scheduling1Framework实现感知节点实际资源负载的调度策略。调度过程中,通过参考节点负载的历史统计,将Pod优先调度到负载较低的节点,实现节点负载均衡的目标,避免出现因单个节点负载过高而导致的应用程序或节点故障。阿里云提供了ack-slo-manager组件来实现。


安装ack-slo-manager组件后,可以通过添加Annotations来标识启动。

imagePullSecrets: {}
 annotations: {}


5. 容器服务集群可观测性


可观测性指如何从外部输出推断及衡量系统内部状态。容器服务可观测性体系包含监控和日志两部分,监控可以帮助DevOps查看系统的运行状态,而日志可以协助问题的排查和诊断。


可观测性包括基础设施层、容器性能层、应用性能层、用户业务层。


image.png


•基础设施层可观测性

容器服务ACK所依赖的底层资源的可观测场景:定位Pod与节点组成的资源的

调用链路,可视化拓扑关系,以及基础设施监控,例如宿主机节点、网络基础组件的性能监控等。

相关实践-基础资源监控


•容器性能层可观测性

基于容器服务ACK构建系统的容器抽象层的可观测场景,包括集群的性能、事

件等监控,容器的性能,以及容器组件等监控。相关实践-Prometheus的监控方案


•应用性能层可观测性

基于容器服务ACK构建系统的具体应用场景,包括应用指标性能(Metric)、系统调用链(Tracing)、日志监控(Logging)等,例如基于容器服务构建一个Java应用,JAVA应用的线程数指标等。

相关实践-无侵入应用监控APM监控方案


•用户业务层可观测性

基于容器服务ACK构建的业务系统的具体业务场景,例如基于容器服务构建一

套高可用可扩展的网站,网站的业务运营数据PV、UV等,例如应用的成本审计场景等。


推荐使用阿里云日志服务SLS(Log Service)作为自定义指标的观测方案。可通过自定义应用系统的内容、格式,并通过日志服务收集,并在日志服务中配置业务大盘,观测自己的业务情况,或做系统审计。


相关实践-通过日志服务采集Kubernetes容器日志


6. 容器服务镜像仓库

阿里云容器镜像服务ACR(Alibaba1Cloud1Container1Registry)是面向容器镜

像、Helm Chart等符合OCI标准的云原生制品安全托管及高效分发平台。其中ACR企业版支持全球同步加速、大规模和大镜像分发加速、多代码源构建加速等全链路加速能力,与容器服务ACK无缝集成,帮助企业降低交付复杂度,打造云原生应用一站式解决方案。


针对游戏跨地域,都能实现快速的分发拉取发布。

相关实践学习
通过容器镜像仓库与容器服务快速部署spring-hello应用
本教程主要讲述如何将本地Java代码程序上传并在云端以容器化的构建、传输和运行。
Kubernetes极速入门
Kubernetes(K8S)是Google在2014年发布的一个开源项目,用于自动化容器化应用程序的部署、扩展和管理。Kubernetes通常结合docker容器工作,并且整合多个运行着docker容器的主机集群。 本课程从Kubernetes的简介、功能、架构,集群的概念、工具及部署等各个方面进行了详细的讲解及展示,通过对本课程的学习,可以对Kubernetes有一个较为全面的认识,并初步掌握Kubernetes相关的安装部署及使用技巧。本课程由黑马程序员提供。   相关的阿里云产品:容器服务 ACK 容器服务 Kubernetes 版(简称 ACK)提供高性能可伸缩的容器应用管理能力,支持企业级容器化应用的全生命周期管理。整合阿里云虚拟化、存储、网络和安全能力,打造云端最佳容器化应用运行环境。 了解产品详情: https://www.aliyun.com/product/kubernetes
相关文章
|
14天前
|
人工智能 运维 监控
阿里云ACK容器服务生产级可观测体系建设实践
本文整理自2024云栖大会冯诗淳(花名:行疾)的演讲,介绍了阿里云容器服务团队在生产级可观测体系建设方面的实践。冯诗淳详细阐述了容器化架构带来的挑战及解决方案,强调了可观测性对于构建稳健运维体系的重要性。文中提到,阿里云作为亚洲唯一蝉联全球领导者的容器管理平台,其可观测能力在多项关键评测中表现优异,支持AI、容器网络、存储等多个场景的高级容器可观测能力。此外,还介绍了阿里云容器服务在多云管理、成本优化等方面的最新进展,以及即将推出的ACK AI助手2.0,旨在通过智能引擎和专家诊断经验,简化异常数据查找,缩短故障响应时间。
阿里云ACK容器服务生产级可观测体系建设实践
|
14天前
|
人工智能 Cloud Native 调度
阿里云容器服务在AI智算场景的创新与实践
本文源自张凯在2024云栖大会的演讲,介绍了阿里云容器服务在AI智算领域的创新与实践。从2018年推出首个开源GPU容器共享调度方案至今,阿里云容器服务不断推进云原生AI的发展,包括增强GPU可观测性、实现多集群跨地域统一调度、优化大模型推理引擎部署、提供灵活的弹性伸缩策略等,旨在为客户提供高效、低成本的云原生AI解决方案。
|
14天前
|
运维 Kubernetes 调度
阿里云容器服务 ACK One 分布式云容器企业落地实践
阿里云容器服务ACK提供强大的产品能力,支持弹性、调度、可观测、成本治理和安全合规。针对拥有IDC或三方资源的企业,ACK One分布式云容器平台能够有效解决资源管理、多云多集群管理及边缘计算等挑战,实现云上云下统一管理,提升业务效率与稳定性。
|
14天前
|
Kubernetes 算法 调度
阿里云 ACK FinOps成本优化最佳实践
本文源自2024云栖大会梁成昊演讲,讨论了成本优化策略的选择与实施。文章首先介绍了成本优化的基本思路,包括优化购买方式、调整资源配置等基础策略,以及使用弹性、资源混部等高级策略。接着,文章详细探讨了集群优化和应用优化的具体方法,如使用抢占式实例降低成本、通过资源画像识别并优化资源配置,以及利用智能应用弹性策略提高资源利用效率。
|
14天前
|
Kubernetes 容灾 调度
阿里云 ACK 高可用稳定性最佳实践
本文整理自2024云栖大会刘佳旭的演讲,主题为《ACK高可用稳定性最佳实践》。文章探讨了云原生高可用架构的重要性,通过Kubernetes的高可用案例分析,介绍了ACK在单集群高可用架构设计、产品能力和最佳实践方面的方法,包括控制面和数据面的高可用策略、工作负载高可用配置、企业版容器镜像服务高可用配置等内容,旨在帮助企业构建更加可靠和高效的应用运行环境。
|
24天前
|
存储 缓存 监控
Docker容器性能调优的关键技巧,涵盖CPU、内存、网络及磁盘I/O的优化策略,结合实战案例,旨在帮助读者有效提升Docker容器的性能与稳定性。
本文介绍了Docker容器性能调优的关键技巧,涵盖CPU、内存、网络及磁盘I/O的优化策略,结合实战案例,旨在帮助读者有效提升Docker容器的性能与稳定性。
63 7
|
28天前
|
Kubernetes Cloud Native 微服务
云原生入门与实践:Kubernetes的简易部署
云原生技术正改变着现代应用的开发和部署方式。本文将引导你了解云原生的基础概念,并重点介绍如何使用Kubernetes进行容器编排。我们将通过一个简易的示例来展示如何快速启动一个Kubernetes集群,并在其上运行一个简单的应用。无论你是云原生新手还是希望扩展现有知识,本文都将为你提供实用的信息和启发性的见解。
|
27天前
|
安全 持续交付 Docker
深入理解并实践容器化技术——Docker 深度解析
深入理解并实践容器化技术——Docker 深度解析
50 2
|
1月前
|
Kubernetes 监控 API
深入解析Kubernetes及其在生产环境中的最佳实践
深入解析Kubernetes及其在生产环境中的最佳实践
49 1
|
1月前
|
Kubernetes 持续交付 开发者
探索并实践Kubernetes集群管理与自动化部署
探索并实践Kubernetes集群管理与自动化部署
50 1