《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(3) https://developer.aliyun.com/article/1230994?groupCode=supportservice
3.2.2.2.5 重保措施列表
•全链路压测
游戏压测计划和业务场景强关联,需要结合业务目标设计,一般通过客户编写全 链路压测机器人或脚本,模拟真实的用户行为(如游戏对战、聊天)。通过机器人压测 评估单服PCU承载能力。建议客户有专门的QA来负责压测与压测机器人的构建、部 署。针对平台服务或web服务接口,可结合阿里云PTS服务快速高效地在线上构造出 真实的超大规模的访问流量。全链路压测是发现系统瓶颈和验证系统能力的最有效方法。
•常见的游戏场景压测关注点举例:
•网关服务器负责所有网络数据包的转发,通常是网络负载较集中的点,压测需 关注网络吞吐能力。
•场景服务器包含游戏逻辑,压测需关注CPU处理能力以及一定的网络吞吐能 力。
•数据中心服务器负责缓存玩家数据并异步入库,保障玩家客户快速获取和写入 数据,对于可用性要求较高,需要配合应用层实现数据容错机制;
•日志服务器承载了大区所有业务行为的日志收集及处理的压力,压测需关注磁 盘写入性能。通常采用多台分组方式实现。
•全链路压测实施流程样例。
全链路压测实施流程 |
|||
阶段 |
步骤 |
说明 |
负责人 |
梳理 |
确认压测目标 |
1、摸底业务吞吐极限,验证架构,探测性 能瓶颈,确定目标压测值 2、梳理压测链路 3、其他 |
客户和阿里云 |
梳理压测链路 架构 |
梳理清楚各个应用从端到端的请求链路、技术架构、 分层结构模块划分,分析潜在的瓶颈点,并针对性 的增加监控指标、制定应急预案 |
客户和阿里云 |
|
梳理业务模型 |
根据实际的业务场景,确认各个接口范围,接口饿的 压测目标,接口出入参数 。 |
客户 |
|
压测机器人 或脚本 |
根据实际的业务场景编写压测机器人或脚本和 压测模型 |
客户 |
|
压测checklist |
1、搭建和生产环境一致的测试环境 2、根据梳理的各个业务接口相关的参数,配置PTS 压测场景。根据业务目标,设定机器人压测数量。 3、测试压测跑通业务链路。 |
客户 |
|
压测 |
记录问题 |
1、压测场景目标是否都达到,是否需要单链路补压 满足流量要求。 2、大盘是否有毛刺和异常下跌情况。 3、上下游流量是否对齐,是否在相同的时间段到达 流量峰值。 4、业务成功率是否满足预期。 5、是否有触发限流,是否属于正常限流场景。 6、是否有系统问题,集群fgc,load偏高,rt偏高 7、是否有数据库热点,数据库异常,rt偏高,连接 池满问题 8、是否有缓存击穿,缓存满足率底问题 9、是否触发异常监控保健 10、其他 |
客户和阿里云 |
其他 |
根据压测过程做梳理和调整 |
客户和阿里云 |
|
优化 改进 |
|
根据压测过程中出现的核心问题理顺并做优化改进 |
|
•风险评估
架构评估:主要从健壮性、安全性、聚合度方面对系统业务架构进行评估,一般 需要从玩家注册登陆,使用游戏内各项功能的整个过程进行全链路评估,主要基于系 统架构图和数据流转图,其评估结果用于反向驱动研发、产品侧的架构优化改进。
技术评估:主要关注线上系统的性能、容量、可用性、安全性等方面,其核心是 保障线上系统中各节点可以满足产品设计指标及业务需求指标,因此需要基于业务目 标,结合用户系统模块阈值、云产品上线等,最终使用性能压测方法来进行验证评估。
•常见风险以上文架构图示例中的分区分服架构图为例:
全局服:端到端全链路性能瓶颈。全局服一般走典型的网站架构: LB+ECS+Redis+RDS,这里需要考虑的相关因素包括LB的并发连接数和新建连接数 要求,LB的DDos防护能力要求,ECS规格匹配度,Redis/RDS的连接数、QPS、是 否有数据倾斜、是否有大key、大value情况
游戏服:要考虑ECS的CPU处理能力、磁盘的读写带宽、单服的带宽上限等因 素。同时,一般采用带宽包来提升带宽峰值,这里需要考虑带宽包可容纳的EIP数 量、单UID下可创建的EIP/带宽包数量等指标。
CDN:游戏CDN一般包含游戏各渠道的游戏首包、更新包,serverlist文件、其 他静态文件。由于现在游戏包体越来越大,一般手游都在3、4G左右,因此在游戏 OB前一般会先开放预下载,同时也会配合运营活动宣传。因此对于预下载的CDN带 宽评估非常重要。CDN产品团队会根据客户评估的CDN峰值带宽做资源预留、避免 CDN资源不足导致的卡顿和下载失败。
安全:一般指DDos安全防护,这里要考虑的因素包括业务带宽、防护带宽、端 口数量等。
此外,大型项目往往会存在产品阈值超额的风险,需要提前结合业务目标做各云 产品的梳理。
•风险评估checklist样例
《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(5) https://developer.aliyun.com/article/1230989?groupCode=supportservice