《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(10)

简介: 《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(10)

《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2   游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(9) https://developer.aliyun.com/article/1230984?groupCode=supportservice



3.2.2.3.5 验证思路


•黑屏与TDR验证

了解完基础概念,这一点也是本次解决黑屏最重要的一点,如图2所示,驱动的 兼容性是否有问题,这一点其实在专项介入早期就已经发现客户在使用解码、编码接 口上用了较为老旧的NVFBC接口(NVFBC接口是NVIDIA提供的相关渲染接口,  是厂 商提供的特定功能接口,具体可点击链接查看,偏视频渲染领域),而在最新的Win - dows Server 2012+开始NV明确表示了不再支持。客户使用FBC接口方式也从客户的 业务日志中有所发现

 

image.png


其次,在客户反馈的黑屏时间段里存在大量的TDR:

 

image.png

事件管理器中类型为Warning的Display事件,EventID为4101,所以接下来的排 查重点就聚焦在:

TDR与黑屏是否有直接关系

DDA与FBC是否为黑屏的突破点

TDR Delay验证


验证第一个问题并不困难,通过对比没有黑屏的机器可以明确的看到没有TDR信 息,同时客户自身采集的逻辑也包含了TDR数量的检测,在TDR数量少的情况下同等 黑屏次数也很少,所以第一个问题基本得到验证,在第一part的图里也可以看到关于 云游戏底层的IaaS逻辑是这样的:

 

image.png


 当出现TDR时,意味着两种可能性,预期内的可能性是当时游戏负载较高,导致 显卡响应不过来了,在3A类型的游戏大作中渲染超2s的情况不算多见,但是也会 有,量级一般可控,量级大到导致黑屏的确实少见,而另外一种预期外的可能就是在 运行时遇到了驱动级或者不可用的函数导致等待不到GPU控制器的回复产生的超 时,为了验证这个理论,我们与GPU研发讨论后,进行了TDR Delay验证,即把TDR

的阈值从2s调整为10s,可以参考以下指引:


image.png


•切换DDA验证

调整TDRDelay后发现黑屏次数确实有两位数的下降,但总量依旧是在千级别, 证明了客户业务确实存在TDR预期内的问题,但是不是黑屏的主因,很可能是因为预 期外问题导致这些预期内的问题被放大,那么做了这个实验后就基本确认TDR问题聚 焦在预期外问题,预期外问题刚好与排查重点2有重合,因为DDA与FBC模式且好是 驱动层面中Rendering阶段核心的接口因素,基于此,我们开始了第二轮实验:对接

 

口进行切换,从FBC切换成DDA观察,非常有幸的是,本来我们都准备拉齐研发资 源帮客户做好切换的相关测试与验证,没想到客户集成了切换模式,切换成DDA成 本很低,所以仅用时1天就完成了50%量从FBC切换DDA的操作,下图是完成后观察 两天的结果,可以看到相对于FBC无论是次数还是发生频率都大幅下降了,基本上证 明FBC为核心问题,而TDR为判断该问题是否解决的标志:


image.png



《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2   游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(11) https://developer.aliyun.com/article/1230982?groupCode=supportservice

相关文章
|
9月前
|
存储 缓存 安全
某鱼电商接口架构深度剖析:从稳定性到高性能的技术密码
某鱼电商接口架构揭秘:分层解耦、安全加固、性能优化三维设计,实现200ms内响应、故障率低于0.1%。详解三层架构、多引擎存储、异步发布、WebSocket通信与全链路防护,助力开发者突破电商接口“三难”困境。
|
10月前
|
数据采集 监控 JavaScript
移动端性能监控探索:鸿蒙 NEXT 探针架构与技术实现
阿里云 ARMS 团队倾力打造的鸿蒙 NEXT SDK,为鸿蒙应用提供了业界领先的全链路监控解决方案。这不仅仅是一个 SDK,更是您洞察用户体验、优化应用性能的智能伙伴。
953 78
|
12月前
|
算法 物联网 定位技术
蓝牙室内定位技术解决方案:核心技术架构与优化实践
本文探讨了蓝牙iBeacon与Lora结合的室内定位技术,分析其在复杂室内环境中的优势与挑战。通过三层架构实现高精度定位,并提出硬件、算法与部署优化方向,助力智慧仓储、医疗等场景智能化升级。
602 0
蓝牙室内定位技术解决方案:核心技术架构与优化实践
|
9月前
|
人工智能 自然语言处理 安全
AI助教系统:基于大模型与智能体架构的新一代教育技术引擎
AI助教系统融合大语言模型、教育知识图谱、多模态交互与智能体架构,实现精准学情诊断、个性化辅导与主动教学。支持图文语音输入,本地化部署保障隐私,重构“教、学、评、辅”全链路,推动因材施教落地,助力教育数字化转型。(238字)
1590 23
|
9月前
|
Java Linux 虚拟化
【Docker】(1)Docker的概述与架构,手把手带你安装Docker,云原生路上不可缺少的一门技术!
1. Docker简介 1.1 Docker是什么 为什么docker会出现? 假定您在开发一款平台项目,您的开发环境具有特定的配置。其他开发人员身处的环境配置也各有不同。 您正在开发的应用依赖于您当前的配置且还要依赖于某些配置文件。 您的企业还拥有标准化的测试和生产环境,且具有自身的配置和一系列支持文件。 **要求:**希望尽可能多在本地模拟这些环境而不产生重新创建服务器环境的开销 问题: 要如何确保应用能够在这些环境中运行和通过质量检测? 在部署过程中不出现令人头疼的版本、配置问题 无需重新编写代码和进行故障修复
733 2
|
11月前
|
机器学习/深度学习 存储 人工智能
RAG系统文本检索优化:Cross-Encoder与Bi-Encoder架构技术对比与选择指南
本文将深入分析这两种编码架构的技术原理、数学基础、实现流程以及各自的优势与局限性,并探讨混合架构的应用策略。
823 10
RAG系统文本检索优化:Cross-Encoder与Bi-Encoder架构技术对比与选择指南
|
10月前
|
Cloud Native API 开发者
Gemini 2.5 Flash 技术拆解:从 MoE 架构到阿里云生态落地指南
2025年9月,谷歌Gemini 2.5 Flash发布,性能提升5%、成本降24%,引发行业关注。其MoE架构、百万上下文与“思考”范式,助力阿里云开发者高效构建云原生应用。本文解析技术内核,结合汽车、物流等案例,提供落地指南与避坑建议,展望大模型与流计算融合前景。
1071 6
|
10月前
|
JSON 供应链 监控
1688商品详情API技术深度解析:从接口架构到数据融合实战
1688商品详情API(item_get接口)可通过商品ID获取标题、价格、库存、SKU等核心数据,适用于价格监控、供应链管理等场景。支持JSON格式返回,需企业认证。Python示例展示如何调用接口获取商品信息。