《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(5)

本文涉及的产品
应用型负载均衡 ALB,每月750个小时 15LCU
网络型负载均衡 NLB,每月750个小时 15LCU
性能测试 PTS,5000VUM额度
简介: 《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(5)

《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2   游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(4) https://developer.aliyun.com/article/1230991?groupCode=supportservice



•容灾限流方案和演练


游戏业务虽然为在线业务,但出于对游戏生命周期、架构复杂度、成本等因素考 虑,一般从架构上没有高可用的容灾设计,主要依赖云产品稳定性和热迁移能力。因 此容灾演练需重点关注高压力下游戏服热迁移的性能和影响情况,业务服务模块间的


隔离性和健壮性、单点故障后的恢复速度等。尤其在使用大规格ECS实例的分服场景 下,需要确定热迁移时TCP连接保活、时钟跳变可在预计时间内完成补偿、机器人无 掉线、真人无感知。

 

 image.png

查项

用例

操作步骤

单个后台服务异常不能导致客户 端不相关逻辑不可用

 

逻辑服异常

1、登录并进行游戏

2、杀死所在的逻辑服务进程

 

 

斗服异常

1、登录并进行游戏

2、杀死所在的战斗服进程

 

 

证服异常

1、登录并进行游戏

2、杀死所在的认证服进程

 

 

服异常

1、登录并进行游戏

2、杀死所在的认证服进程

 

他服务同理

他服务同理

 

可靠的停服公告机

服务可向玩家发送

服公告

1、停服

2、发布停服公

3、启动客户

 

不能有单点故障或单点故障

时间少于xx分钟影响小于x%的用户

 

逻辑服异常

 

杀死单个小区的逻辑服务

他服务同理

他服务同理

 

 

 

 

单个服务进程异常结束不能导致 玩家关键数据丢

 

逻辑服异常

1、客户端登录进游戏

2、客户端使用添加货币、 一级物品、二级物

3、重启单个小区的战斗服

 

Dbgate 异常和对应的Redis, PolarDB异常与重启

1、客户端登录进游戏

2、客户端使用添加货币、 一级物品、二级物

3、重启单个小区的DBGate和对应的Redis\PolarDB

他服务同理

他服务同理

 

服务器模块隔离:单个服务支持独立   重启、单个服务进程异常结束不能引发 其他服务进程异常

服务进程异常、db进程异常

1、随机选择某些小区

2、按随机顺序重启小区的单个服务进程、redis、mysqi进程

sdk平台服务异常

1、关闭所有sdk平台非登录、支付服务模块

(防沉迷、敏感词等模块)

服务器过载保护:接入层需要有 阀值控制

 

最大在线玩家数阀值控制

 

超过当前服务支持最大支持在线玩家数

服务器过载保护:服务器对一段 时间内不活跃连接要强制断开

登录一个玩家后断网

1、手机客户端进游戏

2、手机断开网

服务器负载均衡:同等服务和

务器负载均衡

1、启动压测机器人

数据是动态负载均衡的

sdk平台负载均衡

1、启动压测机器人

 

 

期待结果

1、他逻辑服上的玩家不受影响

2、异常杀死的逻辑服进程可被自动拉起,或者新的玩家请求能被转发到其他正常的逻辑服节点

3、影响时间小于xx分钟,影响的玩家数量小于x%

1、他逻辑服上的玩家不受影响

2、异常杀死的战斗进程可被自动拉起,或者新的玩家请求能被转发到其他正常的战斗服节点

3、影响时间小于xx分钟,影响的玩家数量小于x%

1其他认证服上的的玩家不受影响

2、异常杀死的认证进程可被自动拉起,或者新的玩家请求能被转发到其他正常的认证服节点

3、影响时间小于xx分钟,影响的玩家数量小于x%

1其他网关服上的的玩家不受影响

2、异常杀死的网关服进程可被自动拉起,或者新的玩家请求能被转发到其他正常的网关服节点

3、影响时间小于xx分钟,影响的玩家数量小于x%

他服务同理

1、客户端不能尝试登录

2、停服会自动把在线玩家踢下线

1、等待逻辑服自动拉起

2、启动压测机器人

3、压测数据成功率大xx%,xx%请求响应时间小于xx%秒

他服务同理

1、客户端重新登录

2、查看货币,一级物品,二级物品是否正常

1、客户端重新登录

2、查看货币,一级物品,二级物品是否正常

他服务同理

1、等待重启完成

2、启动压测机器人 3、压测数据正常

1、手机客户端登录,并能进行所有玩法操作

2、启动压测机器人

3、压测数据正常 4、敏感词、防沉迷糊模块全部异常,游戏服务器能否让玩家正常登录、创建角色

1、等待修改生效

2、启动压测机器人

3、观察在线人数是否正确

1、客户端会被动下线

1、各个服务的进程负载情况应该接近

1、登录、支付等各个服务的进程负载情况应该接近

 


《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2   游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(6) https://developer.aliyun.com/article/1230988?groupCode=supportservice

相关实践学习
通过性能测试PTS对云服务器ECS进行规格选择与性能压测
本文为您介绍如何利用性能测试PTS对云服务器ECS进行规格选择与性能压测。
相关文章
|
20天前
|
Kubernetes Cloud Native 微服务
探索云原生技术:容器化与微服务架构的融合之旅
本文将带领读者深入了解云原生技术的核心概念,特别是容器化和微服务架构如何相辅相成,共同构建现代软件系统。我们将通过实际代码示例,探讨如何在云平台上部署和管理微服务,以及如何使用容器编排工具来自动化这一过程。文章旨在为开发者和技术决策者提供实用的指导,帮助他们在云原生时代中更好地设计、部署和维护应用。
|
1月前
|
运维 Kubernetes Cloud Native
云原生技术:容器化与微服务架构的完美结合
【10月更文挑战第37天】在数字化转型的浪潮中,云原生技术以其灵活性和高效性成为企业的新宠。本文将深入探讨云原生的核心概念,包括容器化技术和微服务架构,以及它们如何共同推动现代应用的发展。我们将通过实际代码示例,展示如何在Kubernetes集群上部署一个简单的微服务,揭示云原生技术的强大能力和未来潜力。
|
13天前
|
监控 安全 API
使用PaliGemma2构建多模态目标检测系统:从架构设计到性能优化的技术实践指南
本文详细介绍了PaliGemma2模型的微调流程及其在目标检测任务中的应用。PaliGemma2通过整合SigLIP-So400m视觉编码器与Gemma 2系列语言模型,实现了多模态数据的高效处理。文章涵盖了开发环境构建、数据集预处理、模型初始化与配置、数据加载系统实现、模型微调、推理与评估系统以及性能分析与优化策略等内容。特别强调了计算资源优化、训练过程监控和自动化优化流程的重要性,为机器学习工程师和研究人员提供了系统化的技术方案。
133 77
使用PaliGemma2构建多模态目标检测系统:从架构设计到性能优化的技术实践指南
|
1月前
|
存储 分布式计算 关系型数据库
架构/技术框架调研
本文介绍了微服务间事务处理、调用、大数据处理、分库分表、大文本存储及数据缓存的最优解决方案。重点讨论了Seata、Dubbo、Hadoop生态系统、MyCat、ShardingSphere、对象存储服务和Redis等技术,提供了详细的原理、应用场景和优缺点分析。
|
7天前
|
消息中间件 存储 安全
分布式系统架构3:服务容错
分布式系统因其复杂性,故障几乎是必然的。那么如何让系统在不可避免的故障中依然保持稳定?本文详细介绍了分布式架构中7种核心的服务容错策略,包括故障转移、快速失败、安全失败等,以及它们在实际业务场景中的应用。无论是支付场景的快速失败,还是日志采集的安全失败,每种策略都有自己的适用领域和优缺点。此外,文章还为技术面试提供了解题思路,助你在关键时刻脱颖而出。掌握这些策略,不仅能提升系统健壮性,还能让你的技术栈更上一层楼!快来深入学习,走向架构师之路吧!
42 11
|
20天前
|
运维 Cloud Native 持续交付
云原生技术深度探索:重塑现代IT架构的无形之力####
本文深入剖析了云原生技术的核心概念、关键技术组件及其对现代IT架构变革的深远影响。通过实例解析,揭示云原生如何促进企业实现敏捷开发、弹性伸缩与成本优化,为数字化转型提供强有力的技术支撑。不同于传统综述,本摘要直接聚焦于云原生技术的价值本质,旨在为读者构建一个宏观且具体的技术蓝图。 ####
|
25天前
|
NoSQL Java 数据处理
基于Redis海量数据场景分布式ID架构实践
【11月更文挑战第30天】在现代分布式系统中,生成全局唯一的ID是一个常见且重要的需求。在微服务架构中,各个服务可能需要生成唯一标识符,如用户ID、订单ID等。传统的自增ID已经无法满足在集群环境下保持唯一性的要求,而分布式ID解决方案能够确保即使在多个实例间也能生成全局唯一的标识符。本文将深入探讨如何利用Redis实现分布式ID生成,并通过Java语言展示多个示例,同时分析每个实践方案的优缺点。
55 8
|
1月前
|
Kubernetes Cloud Native Docker
云原生之旅:从传统架构到容器化服务的演变
随着技术的快速发展,云计算已经从简单的虚拟化服务演进到了更加灵活和高效的云原生时代。本文将带你了解云原生的概念、优势以及如何通过容器化技术实现应用的快速部署和扩展。我们将以一个简单的Python Web应用为例,展示如何利用Docker容器进行打包和部署,进而探索Kubernetes如何管理这些容器,确保服务的高可用性和弹性伸缩。
|
27天前
|
Cloud Native 持续交付 云计算
云原生技术在现代IT架构中的转型力量####
本文深入剖析了云原生技术的精髓,探讨其在现代IT架构转型中的关键作用与实践路径。通过具体案例分析,展示了云原生如何赋能企业实现更高效的资源利用、更快的迭代速度以及更强的系统稳定性,为读者提供了一套可借鉴的实施框架与策略。 ####
24 0
|
27天前
|
运维 Kubernetes Docker
深入理解容器化技术及其在微服务架构中的应用
深入理解容器化技术及其在微服务架构中的应用
57 1