《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(4)

本文涉及的产品
性能测试 PTS,5000VUM额度
简介: 《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(4)

《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2   游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(3) https://developer.aliyun.com/article/1230994?groupCode=supportservice



3.2.2.2.5 重保措施列表


•全链路压测


游戏压测计划和业务场景强关联,需要结合业务目标设计,一般通过客户编写全 链路压测机器人或脚本,模拟真实的用户行为(如游戏对战、聊天)。通过机器人压测 评估单服PCU承载能力。建议客户有专门的QA来负责压测与压测机器人的构建、部 署。针对平台服务或web服务接口,可结合阿里云PTS服务快速高效地在线上构造出 真实的超大规模的访问流量。全链路压测是发现系统瓶颈和验证系统能力的最有效方法。


•常见的游戏场景压测关注点举例:


•网关服务器负责所有网络数据包的转发,通常是网络负载较集中的点,压测需 关注网络吞吐能力。

•场景服务器包含游戏逻辑,压测需关注CPU处理能力以及一定的网络吞吐能 力。

•数据中心服务器负责缓存玩家数据并异步入库,保障玩家客户快速获取和写入 数据,对于可用性要求较高,需要配合应用层实现数据容错机制;

•日志服务器承载了大区所有业务行为的日志收集及处理的压力,压测需关注磁 盘写入性能。通常采用多台分组方式实现。

•全链路压测实施流程样例。

 


全链路压测实施流程

说明

责人

 

 

确认压测目标

1、摸底业务吞吐极限,验证架构,探测 能瓶颈,确定目标压测值

2、梳理压测链路

3、其他

客户和阿里云

梳理压测链路 架构

清楚各个应用从端到端的请求链路、技术架构、 结构模块划分,分析潜在的瓶颈点,并针对性   增加监控指标、制定应急预案

客户和阿里云

梳理业务模

实际的业务场景,确认各个接口范围,接口饿的 测目标,接口出入参数 。

客户

测机器人 或脚本

实际的业务场景编写压测机器人或脚本和 测模型

客户

压测checklist

1搭建和生产环境一致的测试环境

2、根据梳理的各个业务接口相关的参数,配PTS 场景。根据业务目标,设定机器人压测数量。

3、测试压测跑通业务链路。

客户

 

 

 

 

记录问题

1、压测场景目标是否都达到,是否需要单链路补压 满足流量要求

2、大盘是否有毛刺和异常下跌情况

3、上下游流量是否对齐,是否在相同的时间段到达 流量峰值

4、业务成功率是否满足预期

5、是否有触发限流,是否属于正常限流场景。

6、是否有系统问题,集群fgcload偏高,rt偏高

7、是否有数据库热点,数据库异常,rt偏高,连接 池满问

8、是否有缓存击穿,缓存满足率底问题

9、是否触发异常监控保

10、其他

 

 

客户和阿里云

根据压测过程做梳理和调整

客户和阿里云

 

根据压测过程中出现的核心问题理顺并做优化改进

 

 

•风险评估


架构评估:主要从健壮性、安全性、聚合度方面对系统业务架构进行评估,一般 需要从玩家注册登陆,使用游戏内各项功能的整个过程进行全链路评估,主要基于系 统架构图和数据流转图,其评估结果用于反向驱动研发、产品侧的架构优化改进。


技术评估:主要关注线上系统的性能、容量、可用性、安全性等方面,其核心是 保障线上系统中各节点可以满足产品设计指标及业务需求指标,因此需要基于业务目 标,结合用户系统模块阈值、云产品上线等,最终使用性能压测方法来进行验证评估


•常见风险以上文架构图示例中的分区分服架构图为例:


全局服:端到端全链路性能瓶颈。全局服一般走典型的网站架构: LB+ECS+Redis+RDS,这里需要考虑的相关因素包括LB的并发连接数和新建连接数 要求,LB的DDos防护能力要求,ECS规格匹配度,Redis/RDS的连接数、QPS、是 否有数据倾斜、是否有大key、大value情况


游戏服:要考虑ECS的CPU处理能力、磁盘的读写带宽、单服的带宽上限等因 素。同时,一般采用带宽包来提升带宽峰值,这里需要考虑带宽包可容纳的EIP数 量、单UID下可创建的EIP/带宽包数量等指标。


CDN:游戏CDN一般包含游戏各渠道的游戏首包、更新包,serverlist文件、其 他静态文件。由于现在游戏包体越来越大,一般手游都在3、4G左右,因此在游戏 OB前一般会先开放预下载,同时也会配合运营活动宣传。因此对于预下载的CDN带 宽评估非常重要。CDN产品团队会根据客户评估的CDN峰值带宽做资源预留、避免 CDN资源不足导致的卡顿和下载失败。


安全:一般指DDos安全防护,这里要考虑的因素包括业务带宽、防护带宽、端 口数量等。


此外,大型项目往往会存在产品阈值超额的风险,需要提前结合业务目标做各云 产品的梳理。

 

•风险评估checklist样例


image.png


《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2   游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(5) https://developer.aliyun.com/article/1230989?groupCode=supportservice


相关文章
|
2月前
|
Cloud Native Java API
聊聊从单体到微服务架构服务演化过程
本文介绍了从单体应用到微服务再到云原生架构的演进过程。单体应用虽易于搭建和部署,但难以局部更新;面向服务架构(SOA)通过模块化和服务总线提升了组件复用性和分布式部署能力;微服务则进一步实现了服务的独立开发与部署,提高了灵活性;云原生架构则利用容器化、微服务和自动化工具,实现了应用在动态环境中的弹性扩展与高效管理。这一演进体现了软件架构向着更灵活、更高效的方向发展。
|
3月前
|
存储 Linux KVM
Proxmox VE (PVE) 主要架构和重要服务介绍
Proxmox VE (PVE) 是一款开源的虚拟化平台,它基于 KVM (Kernel-based Virtual Machine) 和 LXC (Linux Containers) 技术,支持虚拟机和容器的运行。PVE 还提供高可用集群管理、软件定义存储、备份和恢复以及网络管理等企业级功能。
1369 7
|
7天前
|
消息中间件 存储 安全
分布式系统架构3:服务容错
分布式系统因其复杂性,故障几乎是必然的。那么如何让系统在不可避免的故障中依然保持稳定?本文详细介绍了分布式架构中7种核心的服务容错策略,包括故障转移、快速失败、安全失败等,以及它们在实际业务场景中的应用。无论是支付场景的快速失败,还是日志采集的安全失败,每种策略都有自己的适用领域和优缺点。此外,文章还为技术面试提供了解题思路,助你在关键时刻脱颖而出。掌握这些策略,不仅能提升系统健壮性,还能让你的技术栈更上一层楼!快来深入学习,走向架构师之路吧!
42 11
|
25天前
|
NoSQL Java 数据处理
基于Redis海量数据场景分布式ID架构实践
【11月更文挑战第30天】在现代分布式系统中,生成全局唯一的ID是一个常见且重要的需求。在微服务架构中,各个服务可能需要生成唯一标识符,如用户ID、订单ID等。传统的自增ID已经无法满足在集群环境下保持唯一性的要求,而分布式ID解决方案能够确保即使在多个实例间也能生成全局唯一的标识符。本文将深入探讨如何利用Redis实现分布式ID生成,并通过Java语言展示多个示例,同时分析每个实践方案的优缺点。
55 8
|
1月前
|
Kubernetes Cloud Native Docker
云原生之旅:从传统架构到容器化服务的演变
随着技术的快速发展,云计算已经从简单的虚拟化服务演进到了更加灵活和高效的云原生时代。本文将带你了解云原生的概念、优势以及如何通过容器化技术实现应用的快速部署和扩展。我们将以一个简单的Python Web应用为例,展示如何利用Docker容器进行打包和部署,进而探索Kubernetes如何管理这些容器,确保服务的高可用性和弹性伸缩。
|
29天前
|
边缘计算 监控 自动驾驶
揭秘云计算中的边缘计算:架构、优势及应用场景
揭秘云计算中的边缘计算:架构、优势及应用场景
|
2月前
|
消息中间件 Kafka 数据库
微服务架构中,如何确保服务之间的数据一致性?
微服务架构中,如何确保服务之间的数据一致性?
|
2月前
|
SQL 存储 分布式计算
大数据-157 Apache Kylin 背景 历程 特点 场景 架构 组件 详解
大数据-157 Apache Kylin 背景 历程 特点 场景 架构 组件 详解
44 9
|
2月前
|
存储 分布式计算 druid
大数据-155 Apache Druid 架构与原理详解 数据存储 索引服务 压缩机制
大数据-155 Apache Druid 架构与原理详解 数据存储 索引服务 压缩机制
71 3
|
3月前
|
消息中间件 Kafka 数据库
微服务架构中,如何确保服务之间的数据一致性
微服务架构中,如何确保服务之间的数据一致性