《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(5)

简介: 《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(5)

《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2   游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(4) https://developer.aliyun.com/article/1230991?groupCode=supportservice



•容灾限流方案和演练


游戏业务虽然为在线业务,但出于对游戏生命周期、架构复杂度、成本等因素考 虑,一般从架构上没有高可用的容灾设计,主要依赖云产品稳定性和热迁移能力。因 此容灾演练需重点关注高压力下游戏服热迁移的性能和影响情况,业务服务模块间的


隔离性和健壮性、单点故障后的恢复速度等。尤其在使用大规格ECS实例的分服场景 下,需要确定热迁移时TCP连接保活、时钟跳变可在预计时间内完成补偿、机器人无 掉线、真人无感知。

 

 image.png

查项

用例

操作步骤

单个后台服务异常不能导致客户 端不相关逻辑不可用

 

逻辑服异常

1、登录并进行游戏

2、杀死所在的逻辑服务进程

 

 

斗服异常

1、登录并进行游戏

2、杀死所在的战斗服进程

 

 

证服异常

1、登录并进行游戏

2、杀死所在的认证服进程

 

 

服异常

1、登录并进行游戏

2、杀死所在的认证服进程

 

他服务同理

他服务同理

 

可靠的停服公告机

服务可向玩家发送

服公告

1、停服

2、发布停服公

3、启动客户

 

不能有单点故障或单点故障

时间少于xx分钟影响小于x%的用户

 

逻辑服异常

 

杀死单个小区的逻辑服务

他服务同理

他服务同理

 

 

 

 

单个服务进程异常结束不能导致 玩家关键数据丢

 

逻辑服异常

1、客户端登录进游戏

2、客户端使用添加货币、 一级物品、二级物

3、重启单个小区的战斗服

 

Dbgate 异常和对应的Redis, PolarDB异常与重启

1、客户端登录进游戏

2、客户端使用添加货币、 一级物品、二级物

3、重启单个小区的DBGate和对应的Redis\PolarDB

他服务同理

他服务同理

 

服务器模块隔离:单个服务支持独立   重启、单个服务进程异常结束不能引发 其他服务进程异常

服务进程异常、db进程异常

1、随机选择某些小区

2、按随机顺序重启小区的单个服务进程、redis、mysqi进程

sdk平台服务异常

1、关闭所有sdk平台非登录、支付服务模块

(防沉迷、敏感词等模块)

服务器过载保护:接入层需要有 阀值控制

 

最大在线玩家数阀值控制

 

超过当前服务支持最大支持在线玩家数

服务器过载保护:服务器对一段 时间内不活跃连接要强制断开

登录一个玩家后断网

1、手机客户端进游戏

2、手机断开网

服务器负载均衡:同等服务和

务器负载均衡

1、启动压测机器人

数据是动态负载均衡的

sdk平台负载均衡

1、启动压测机器人

 

 

期待结果

1、他逻辑服上的玩家不受影响

2、异常杀死的逻辑服进程可被自动拉起,或者新的玩家请求能被转发到其他正常的逻辑服节点

3、影响时间小于xx分钟,影响的玩家数量小于x%

1、他逻辑服上的玩家不受影响

2、异常杀死的战斗进程可被自动拉起,或者新的玩家请求能被转发到其他正常的战斗服节点

3、影响时间小于xx分钟,影响的玩家数量小于x%

1其他认证服上的的玩家不受影响

2、异常杀死的认证进程可被自动拉起,或者新的玩家请求能被转发到其他正常的认证服节点

3、影响时间小于xx分钟,影响的玩家数量小于x%

1其他网关服上的的玩家不受影响

2、异常杀死的网关服进程可被自动拉起,或者新的玩家请求能被转发到其他正常的网关服节点

3、影响时间小于xx分钟,影响的玩家数量小于x%

他服务同理

1、客户端不能尝试登录

2、停服会自动把在线玩家踢下线

1、等待逻辑服自动拉起

2、启动压测机器人

3、压测数据成功率大xx%,xx%请求响应时间小于xx%秒

他服务同理

1、客户端重新登录

2、查看货币,一级物品,二级物品是否正常

1、客户端重新登录

2、查看货币,一级物品,二级物品是否正常

他服务同理

1、等待重启完成

2、启动压测机器人 3、压测数据正常

1、手机客户端登录,并能进行所有玩法操作

2、启动压测机器人

3、压测数据正常 4、敏感词、防沉迷糊模块全部异常,游戏服务器能否让玩家正常登录、创建角色

1、等待修改生效

2、启动压测机器人

3、观察在线人数是否正确

1、客户端会被动下线

1、各个服务的进程负载情况应该接近

1、登录、支付等各个服务的进程负载情况应该接近

 


《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2   游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(6) https://developer.aliyun.com/article/1230988?groupCode=supportservice

相关文章
|
5月前
|
存储 缓存 安全
某鱼电商接口架构深度剖析:从稳定性到高性能的技术密码
某鱼电商接口架构揭秘:分层解耦、安全加固、性能优化三维设计,实现200ms内响应、故障率低于0.1%。详解三层架构、多引擎存储、异步发布、WebSocket通信与全链路防护,助力开发者突破电商接口“三难”困境。
|
8月前
|
算法 物联网 定位技术
蓝牙室内定位技术解决方案:核心技术架构与优化实践
本文探讨了蓝牙iBeacon与Lora结合的室内定位技术,分析其在复杂室内环境中的优势与挑战。通过三层架构实现高精度定位,并提出硬件、算法与部署优化方向,助力智慧仓储、医疗等场景智能化升级。
438 0
蓝牙室内定位技术解决方案:核心技术架构与优化实践
|
6月前
|
数据采集 监控 JavaScript
移动端性能监控探索:鸿蒙 NEXT 探针架构与技术实现
阿里云 ARMS 团队倾力打造的鸿蒙 NEXT SDK,为鸿蒙应用提供了业界领先的全链路监控解决方案。这不仅仅是一个 SDK,更是您洞察用户体验、优化应用性能的智能伙伴。
777 53
|
5月前
|
人工智能 自然语言处理 安全
AI助教系统:基于大模型与智能体架构的新一代教育技术引擎
AI助教系统融合大语言模型、教育知识图谱、多模态交互与智能体架构,实现精准学情诊断、个性化辅导与主动教学。支持图文语音输入,本地化部署保障隐私,重构“教、学、评、辅”全链路,推动因材施教落地,助力教育数字化转型。(238字)
951 23
|
5月前
|
Java Linux 虚拟化
【Docker】(1)Docker的概述与架构,手把手带你安装Docker,云原生路上不可缺少的一门技术!
1. Docker简介 1.1 Docker是什么 为什么docker会出现? 假定您在开发一款平台项目,您的开发环境具有特定的配置。其他开发人员身处的环境配置也各有不同。 您正在开发的应用依赖于您当前的配置且还要依赖于某些配置文件。 您的企业还拥有标准化的测试和生产环境,且具有自身的配置和一系列支持文件。 **要求:**希望尽可能多在本地模拟这些环境而不产生重新创建服务器环境的开销 问题: 要如何确保应用能够在这些环境中运行和通过质量检测? 在部署过程中不出现令人头疼的版本、配置问题 无需重新编写代码和进行故障修复
516 2
|
6月前
|
Cloud Native API 开发者
Gemini 2.5 Flash 技术拆解:从 MoE 架构到阿里云生态落地指南
2025年9月,谷歌Gemini 2.5 Flash发布,性能提升5%、成本降24%,引发行业关注。其MoE架构、百万上下文与“思考”范式,助力阿里云开发者高效构建云原生应用。本文解析技术内核,结合汽车、物流等案例,提供落地指南与避坑建议,展望大模型与流计算融合前景。
751 6
|
7月前
|
机器学习/深度学习 存储 人工智能
RAG系统文本检索优化:Cross-Encoder与Bi-Encoder架构技术对比与选择指南
本文将深入分析这两种编码架构的技术原理、数学基础、实现流程以及各自的优势与局限性,并探讨混合架构的应用策略。
525 10
RAG系统文本检索优化:Cross-Encoder与Bi-Encoder架构技术对比与选择指南
|
5月前
|
存储 人工智能 搜索推荐
拔俗AI助教系统:基于大模型与智能体架构的新一代教育技术引擎
AI助教融合大语言模型、教育知识图谱、多模态感知与智能体技术,重构“教、学、评、辅”全链路。通过微调LLM、精准诊断错因、多模态交互与自主任务规划,实现个性化教学。轻量化部署与隐私保护设计保障落地安全,未来将向情感感知与教育深度协同演进。(238字)
583 0

热门文章

最新文章