《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.2 游戏容器化部署最佳实践(1) https://developer.aliyun.com/article/1232003?groupCode=supportservice
2. 应用部署
•节点实例选型
部署容器服务的worker节点时,需要选择对应的ECS实例类型,在阿里云控制
台的购买页面上可以看到,实例规格族的选择上分成三大模块:架构、分类、具体信息。实例规格架构的类型,有三种架构类型,分别是通用的X86的架构、异构计算(像GPU或者是FPGA、NPU等)、阿里云自研的神龙裸金属架构。
下面主要来介绍X86的实例规格的,分成了5种:
第一种实例规格是通用型,顾名思义基本可以适配任何场景,所以这种型号的代称是g系列,它的vCPU和内存的一个配比是1:4。
第二种实例规格是计算型,顾名思义就是在某些场景下对CPU算力的要求会更高一点,所以它的vCPU和内存的配比是1:2,简称为c系列。
第三种类型是内存型,提供更多的内存能力,所以它的CPU和内存的配比是1:8
,也简称为r系列。
第四种和第五种分别是大数据型和本地SSD型,这两种的CPU和内存的配比都是1:4,只是它们配的本地盘的类型是不一样的,导致它们的技能和适合的场景也是不一样的。
在以上5个基础的实例规格上面,阿里云也会去做一些额外的能力提升,比如说在通用型、计算型和内存型这三种类型下,增加了一些高主频的能力,正常的CPU的主频应该是2.5GHZ,但是有一些可以是做到3.1GHZ甚至更高,这种加上高主频的能力就变成了高主频型,会在前面去加上一个hf这样的一个标识。针对有高计算性能的业务场景可以优选选择。
另外,随着技术的演进,阿里云神龙架构的神龙卡也是在不断地迭代和改善,搭载的神龙卡可以整体提升通用型、计算型和内存型这三种实例规格的性能,所以就会出现一个平衡增强型。对于大数据型的话,做了计算和存储的分离,形成了大数据存储型,简称为d2,而d2s是在大数据的基础上,做了一些网络能力的增强,就变成了一个网络增强型。
除了特定的架构和分类,还有代系的差别,当前代表示的是最新的代系,其数字越大代表它是更新的一个代系,它底层的物理硬件也会越新,它的性价比相对而言也会更越高。
在选择实例规格上面,需要对自己的业务特征做一些分析,包括对性能的要求,对网络的要求,形成一个基本的判断,或者可以提前做下压测对比,进而针对业务特征来选择对应的实例规格以及付费方式,只有选择最合适的规格和对应的付费方式,才能够实现云上的成本最优。
•网络模型选型
容器化应用会在同一个节点上部署多个业务,而每个业务都需要自己的网络空间。为避免与其他业务网络冲突,Pod需要有自己独立的网络空间,而Pod中应用需要和其他网络进行通信,就需要Pod能够跟不同的网络互相访问。进而产生了多种网络模型来实现上述容器网络的能力,阿里云容器服务平台主要包括Flannel和Terway网络模式。如下是两种模型的对比。
在Terway网络插件中,每个Pod都拥有自己网络栈和IP地址。同一台ECS内的
Pod之间通信,直接通过机器内部的转发,跨ECS的Pod通信、报文通过VPC的弹性网卡直接转发。由于不需要使用VxLAN等的隧道技术封装报文,因此Terway模式网络具有较高的通信性能。
一旦集群创建完成后,不支持Flannel与Terway之间的变更切换,在实践过程
中,推荐Terway网络模式。
Terway网络模式采用的是云原生的网络方案,直接基于阿里云的虚拟化网络中
的弹性网卡资源来构建的容器网络。Pod会通过弹性网卡资源直接分配VPC中的IP地址,而不需要额外指定虚拟Pod网段。
Terway网络模式的特点是:
•容器和虚拟机在同一层网络,便于业务云原生化迁移。
•不依赖封包或者路由表,分配给容器的网络设备本身可以用来通信。
•集群节点规模不受路由表或者封包的FDB转发表等配额限制。
•不需要额外为容器规划Overlay的网段,多个集群容器之间只要设置安全组开放端口就可以互相通信。
•可以直接把容器挂到SLB后端,无需在节点上使用NodePort进行转发。
•NAT网关可以对容器做SNAT,无需节点上对容器网段做SNAT:容器访问VPC
内资源,所带的源IP都是容器IP,便于审计;容器访问外部网络不依赖conntrack SNAT,降低失败率。
•Terway网络模式支持通过网络策略(NetworkPolicy)配置Pod间网络访问的规
则。网络策略(NetworkPolicy)是一种关于Pod间及Pod与其他网络端点间所允许的通信规则的规范。NetworkPolicy资源使用标签选择Pod,并定义选定Pod所允许的通信规则。
•在使用Alibaba Cloud Linux 2系统作为节点的操作系统时,Terway网络模式支持使用更高效的IPvlan+eBPF链路,加速容器网络性能。
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.1 游戏业务稳定性保障——5.1.2 游戏容器化部署最佳实践(3) https://developer.aliyun.com/article/1231999?groupCode=supportservice