《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(5)

简介: 《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(5)

《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2   游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(4) https://developer.aliyun.com/article/1230991?groupCode=supportservice



•容灾限流方案和演练


游戏业务虽然为在线业务,但出于对游戏生命周期、架构复杂度、成本等因素考 虑,一般从架构上没有高可用的容灾设计,主要依赖云产品稳定性和热迁移能力。因 此容灾演练需重点关注高压力下游戏服热迁移的性能和影响情况,业务服务模块间的


隔离性和健壮性、单点故障后的恢复速度等。尤其在使用大规格ECS实例的分服场景 下,需要确定热迁移时TCP连接保活、时钟跳变可在预计时间内完成补偿、机器人无 掉线、真人无感知。

 

 image.png

查项

用例

操作步骤

单个后台服务异常不能导致客户 端不相关逻辑不可用

 

逻辑服异常

1、登录并进行游戏

2、杀死所在的逻辑服务进程

 

 

斗服异常

1、登录并进行游戏

2、杀死所在的战斗服进程

 

 

证服异常

1、登录并进行游戏

2、杀死所在的认证服进程

 

 

服异常

1、登录并进行游戏

2、杀死所在的认证服进程

 

他服务同理

他服务同理

 

可靠的停服公告机

服务可向玩家发送

服公告

1、停服

2、发布停服公

3、启动客户

 

不能有单点故障或单点故障

时间少于xx分钟影响小于x%的用户

 

逻辑服异常

 

杀死单个小区的逻辑服务

他服务同理

他服务同理

 

 

 

 

单个服务进程异常结束不能导致 玩家关键数据丢

 

逻辑服异常

1、客户端登录进游戏

2、客户端使用添加货币、 一级物品、二级物

3、重启单个小区的战斗服

 

Dbgate 异常和对应的Redis, PolarDB异常与重启

1、客户端登录进游戏

2、客户端使用添加货币、 一级物品、二级物

3、重启单个小区的DBGate和对应的Redis\PolarDB

他服务同理

他服务同理

 

服务器模块隔离:单个服务支持独立   重启、单个服务进程异常结束不能引发 其他服务进程异常

服务进程异常、db进程异常

1、随机选择某些小区

2、按随机顺序重启小区的单个服务进程、redis、mysqi进程

sdk平台服务异常

1、关闭所有sdk平台非登录、支付服务模块

(防沉迷、敏感词等模块)

服务器过载保护:接入层需要有 阀值控制

 

最大在线玩家数阀值控制

 

超过当前服务支持最大支持在线玩家数

服务器过载保护:服务器对一段 时间内不活跃连接要强制断开

登录一个玩家后断网

1、手机客户端进游戏

2、手机断开网

服务器负载均衡:同等服务和

务器负载均衡

1、启动压测机器人

数据是动态负载均衡的

sdk平台负载均衡

1、启动压测机器人

 

 

期待结果

1、他逻辑服上的玩家不受影响

2、异常杀死的逻辑服进程可被自动拉起,或者新的玩家请求能被转发到其他正常的逻辑服节点

3、影响时间小于xx分钟,影响的玩家数量小于x%

1、他逻辑服上的玩家不受影响

2、异常杀死的战斗进程可被自动拉起,或者新的玩家请求能被转发到其他正常的战斗服节点

3、影响时间小于xx分钟,影响的玩家数量小于x%

1其他认证服上的的玩家不受影响

2、异常杀死的认证进程可被自动拉起,或者新的玩家请求能被转发到其他正常的认证服节点

3、影响时间小于xx分钟,影响的玩家数量小于x%

1其他网关服上的的玩家不受影响

2、异常杀死的网关服进程可被自动拉起,或者新的玩家请求能被转发到其他正常的网关服节点

3、影响时间小于xx分钟,影响的玩家数量小于x%

他服务同理

1、客户端不能尝试登录

2、停服会自动把在线玩家踢下线

1、等待逻辑服自动拉起

2、启动压测机器人

3、压测数据成功率大xx%,xx%请求响应时间小于xx%秒

他服务同理

1、客户端重新登录

2、查看货币,一级物品,二级物品是否正常

1、客户端重新登录

2、查看货币,一级物品,二级物品是否正常

他服务同理

1、等待重启完成

2、启动压测机器人 3、压测数据正常

1、手机客户端登录,并能进行所有玩法操作

2、启动压测机器人

3、压测数据正常 4、敏感词、防沉迷糊模块全部异常,游戏服务器能否让玩家正常登录、创建角色

1、等待修改生效

2、启动压测机器人

3、观察在线人数是否正确

1、客户端会被动下线

1、各个服务的进程负载情况应该接近

1、登录、支付等各个服务的进程负载情况应该接近

 


《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2   游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(6) https://developer.aliyun.com/article/1230988?groupCode=supportservice

相关文章
|
8月前
|
消息中间件 负载均衡 中间件
⚡ 构建真正的高性能即时通讯服务:基于 Netty 集群的架构设计与实现
本文介绍了如何基于 Netty 构建分布式即时通讯集群。随着用户量增长,单体架构面临性能瓶颈,文章对比了三种集群方案:Nginx 负载均衡、注册中心服务发现与基于 ZooKeeper 的消息路由架构。最终选择第三种方案,通过 ZooKeeper 实现服务注册发现与消息路由,并结合 RabbitMQ 支持跨服务器消息广播。文中还详细讲解了 ZooKeeper 搭建、Netty 集群改造、动态端口分配、服务注册、负载均衡及消息广播的实现,构建了一个高可用、可水平扩展的即时通讯系统。
910 0
|
8月前
|
文字识别 运维 监控
架构解密|一步步打造高可用的 JOCR OCR 识别服务
本文深入解析了JOCR OCR识别服务的高可用架构设计,涵盖从用户上传、智能调度、核心识别到容错监控的完整链路,助力打造高性能、低成本的工业级OCR服务。
355 0
架构解密|一步步打造高可用的 JOCR OCR 识别服务
|
9月前
|
关系型数据库 MySQL 分布式数据库
Super MySQL|揭秘PolarDB全异步执行架构,高并发场景性能利器
阿里云瑶池旗下的云原生数据库PolarDB MySQL版设计了基于协程的全异步执行架构,实现鉴权、事务提交、锁等待等核心逻辑的异步化执行,这是业界首个真正意义上实现全异步执行架构的MySQL数据库产品,显著提升了PolarDB MySQL的高并发处理能力,其中通用写入性能提升超过70%,长尾延迟降低60%以上。
|
12月前
|
消息中间件 人工智能 监控
文生图架构设计原来如此简单之分布式服务
想象一下,当成千上万的用户同时要求AI画图,如何公平高效地处理这些请求?文生图/图生图大模型的架构设计看似复杂,实则遵循简单而有效的原则:合理排队、分工明确、防患未然。
453 14
文生图架构设计原来如此简单之分布式服务
|
9月前
|
消息中间件 存储 大数据
阿里云消息队列 Kafka 架构及典型应用场景
阿里云消息队列 Kafka 是一款基于 Apache Kafka 的分布式消息中间件,支持消息发布与订阅模型,满足微服务解耦、大数据处理及实时流数据分析需求。其通过存算分离架构优化成本与性能,提供基础版、标准版和专业版三种 Serverless 版本,分别适用于不同业务场景,最高 SLA 达 99.99%。阿里云 Kafka 还具备弹性扩容、多可用区部署、冷热数据缓存隔离等特性,并支持与 Flink、MaxCompute 等生态工具无缝集成,广泛应用于用户行为分析、数据入库等场景,显著提升数据处理效率与实时性。
|
11月前
|
存储 人工智能 自然语言处理
Cursor这类编程Agent软件的模型架构与工作流程
编程Agent的核心是一个强大的大语言模型,负责理解用户意图并生成相应的代码和解决方案。这些模型通过海量文本和代码数据的训练,掌握了广泛的编程知识和语言理解能力。
1090 1
|
安全 容灾 网络安全
深度用云——释放企业潜能 | 网络先行——阿里云网络卓越架构白皮书正式发布
深度用云——释放企业潜能 | 网络先行——阿里云网络卓越架构白皮书正式发布
590 3
|
存储 JavaScript 开发工具
基于HarmonyOS 5.0(NEXT)与SpringCloud架构的跨平台应用开发与服务集成研究【实战】
本次的.HarmonyOS Next ,ArkTS语言,HarmonyOS的元服务和DevEco Studio 开发工具,为开发者提供了构建现代化、轻量化、高性能应用的便捷方式。这些技术和工具将帮助开发者更好地适应未来的智能设备和服务提供方式。
基于HarmonyOS 5.0(NEXT)与SpringCloud架构的跨平台应用开发与服务集成研究【实战】
|
人工智能 运维 监控
云卓越架构:企业稳定性架构体系和AI业务场景探秘
本次分享由阿里云智能集团公共云技术服务部上海零售技术服务高级经理路志华主讲,主题为“云卓越架构:企业稳定性架构体系和AI业务场景探秘”。内容涵盖四个部分:1) 稳定性架构设计,强调高可用、可扩展性、安全性和可维护性;2) 稳定性保障体系和应急体系的建立,确保快速响应和恢复;3) 重大活动时的稳定重宝策略,如大促或新业务上线;4) AI在企业中的应用场景,包括智能编码、知识库问答、创意广告生成等。通过这些内容,帮助企业在云计算环境中构建更加稳定和高效的架构,并探索AI技术带来的创新机会。
|
消息中间件 存储 安全
分布式系统架构3:服务容错
分布式系统因其复杂性,故障几乎是必然的。那么如何让系统在不可避免的故障中依然保持稳定?本文详细介绍了分布式架构中7种核心的服务容错策略,包括故障转移、快速失败、安全失败等,以及它们在实际业务场景中的应用。无论是支付场景的快速失败,还是日志采集的安全失败,每种策略都有自己的适用领域和优缺点。此外,文章还为技术面试提供了解题思路,助你在关键时刻脱颖而出。掌握这些策略,不仅能提升系统健壮性,还能让你的技术栈更上一层楼!快来深入学习,走向架构师之路吧!
510 12

热门文章

最新文章