《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(10)

简介: 《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(10)

《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2   游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(9) https://developer.aliyun.com/article/1230984?groupCode=supportservice



3.2.2.3.5 验证思路


•黑屏与TDR验证

了解完基础概念,这一点也是本次解决黑屏最重要的一点,如图2所示,驱动的 兼容性是否有问题,这一点其实在专项介入早期就已经发现客户在使用解码、编码接 口上用了较为老旧的NVFBC接口(NVFBC接口是NVIDIA提供的相关渲染接口,  是厂 商提供的特定功能接口,具体可点击链接查看,偏视频渲染领域),而在最新的Win - dows Server 2012+开始NV明确表示了不再支持。客户使用FBC接口方式也从客户的 业务日志中有所发现

 

image.png


其次,在客户反馈的黑屏时间段里存在大量的TDR:

 

image.png

事件管理器中类型为Warning的Display事件,EventID为4101,所以接下来的排 查重点就聚焦在:

TDR与黑屏是否有直接关系

DDA与FBC是否为黑屏的突破点

TDR Delay验证


验证第一个问题并不困难,通过对比没有黑屏的机器可以明确的看到没有TDR信 息,同时客户自身采集的逻辑也包含了TDR数量的检测,在TDR数量少的情况下同等 黑屏次数也很少,所以第一个问题基本得到验证,在第一part的图里也可以看到关于 云游戏底层的IaaS逻辑是这样的:

 

image.png


 当出现TDR时,意味着两种可能性,预期内的可能性是当时游戏负载较高,导致 显卡响应不过来了,在3A类型的游戏大作中渲染超2s的情况不算多见,但是也会 有,量级一般可控,量级大到导致黑屏的确实少见,而另外一种预期外的可能就是在 运行时遇到了驱动级或者不可用的函数导致等待不到GPU控制器的回复产生的超 时,为了验证这个理论,我们与GPU研发讨论后,进行了TDR Delay验证,即把TDR

的阈值从2s调整为10s,可以参考以下指引:


image.png


•切换DDA验证

调整TDRDelay后发现黑屏次数确实有两位数的下降,但总量依旧是在千级别, 证明了客户业务确实存在TDR预期内的问题,但是不是黑屏的主因,很可能是因为预 期外问题导致这些预期内的问题被放大,那么做了这个实验后就基本确认TDR问题聚 焦在预期外问题,预期外问题刚好与排查重点2有重合,因为DDA与FBC模式且好是 驱动层面中Rendering阶段核心的接口因素,基于此,我们开始了第二轮实验:对接

 

口进行切换,从FBC切换成DDA观察,非常有幸的是,本来我们都准备拉齐研发资 源帮客户做好切换的相关测试与验证,没想到客户集成了切换模式,切换成DDA成 本很低,所以仅用时1天就完成了50%量从FBC切换DDA的操作,下图是完成后观察 两天的结果,可以看到相对于FBC无论是次数还是发生频率都大幅下降了,基本上证 明FBC为核心问题,而TDR为判断该问题是否解决的标志:


image.png



《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2   游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(11) https://developer.aliyun.com/article/1230982?groupCode=supportservice

相关文章
|
6天前
|
运维 Kubernetes Cloud Native
云原生技术:容器化与微服务架构的完美结合
【10月更文挑战第37天】在数字化转型的浪潮中,云原生技术以其灵活性和高效性成为企业的新宠。本文将深入探讨云原生的核心概念,包括容器化技术和微服务架构,以及它们如何共同推动现代应用的发展。我们将通过实际代码示例,展示如何在Kubernetes集群上部署一个简单的微服务,揭示云原生技术的强大能力和未来潜力。
|
14天前
|
运维 持续交付 API
从零构建微服务架构:一次深度技术探索之旅####
【10月更文挑战第28天】 本文记录了作者在从零开始构建微服务架构过程中的深刻技术感悟,通过实战案例详细剖析了微服务设计、开发、部署及运维中的关键要点与挑战。文章首先概述了微服务架构的核心理念及其对企业IT架构转型的重要性,随后深入探讨了服务拆分策略、API网关选型、服务间通信协议选择、容器化部署(Docker+Kubernetes)、以及持续集成/持续部署(CI/CD)流程的设计与优化。最后,分享了在高并发场景下的性能调优经验与故障排查心得,旨在为读者提供一套可借鉴的微服务架构实施路径。 ####
54 3
|
25天前
|
边缘计算 Cloud Native 安全
构建灵活高效的下一代应用架构 随着企业数字化转型的加速,云原生技术正逐渐成为构建现代化应用程序的关键支柱。
随着企业数字化转型加速,云原生技术逐渐成为构建现代化应用的关键。本文探讨了云原生的核心概念(如容器化、微服务、DevOps)、主要应用场景(如金融、电商、IoT)及未来发展趋势(如无服务器计算、边缘计算、多云架构),并分析了面临的挑战,如架构复杂性和安全问题。云原生技术为企业提供了更灵活、高效的应用架构,助力数字化转型。
57 4
|
4天前
|
存储 分布式计算 关系型数据库
架构/技术框架调研
本文介绍了微服务间事务处理、调用、大数据处理、分库分表、大文本存储及数据缓存的最优解决方案。重点讨论了Seata、Dubbo、Hadoop生态系统、MyCat、ShardingSphere、对象存储服务和Redis等技术,提供了详细的原理、应用场景和优缺点分析。
|
6天前
|
监控 API 微服务
后端技术演进:从单体架构到微服务的转变
随着互联网应用的快速增长和用户需求的不断演化,传统单体架构已难以满足现代软件开发的需求。本文深入探讨了后端技术在面对复杂系统挑战时的演进路径,重点分析了从单体架构向微服务架构转变的过程、原因及优势。通过对比分析,揭示了微服务架构如何提高系统的可扩展性、灵活性和维护效率,同时指出了实施微服务时面临的挑战和最佳实践。
25 7
|
4天前
|
传感器 算法 物联网
智能停车解决方案之停车场室内导航系统(二):核心技术与系统架构构建
随着城市化进程的加速,停车难问题日益凸显。本文深入剖析智能停车系统的关键技术,包括停车场电子地图编辑绘制、物联网与传感器技术、大数据与云计算的应用、定位技术及车辆导航路径规划,为读者提供全面的技术解决方案。系统架构分为应用层、业务层、数据层和运行环境,涵盖停车场室内导航、车位占用检测、动态更新、精准导航和路径规划等方面。
29 4
|
23天前
|
Kubernetes Cloud Native 持续交付
云端新纪元:云原生技术重塑IT架构####
【10月更文挑战第20天】 本文深入探讨了云原生技术的兴起背景、核心理念、关键技术组件以及它如何引领现代IT架构迈向更高效、灵活与可扩展的新阶段。通过剖析Kubernetes、微服务、Docker等核心技术,本文揭示了云原生架构如何优化资源利用、加速应用开发与部署流程,并促进企业数字化转型的深度实践。 ####
|
5天前
|
Kubernetes Cloud Native 持续交付
云原生技术在现代应用架构中的实践与思考
【10月更文挑战第38天】随着云计算的不断成熟和演进,云原生(Cloud-Native)已成为推动企业数字化转型的重要力量。本文从云原生的基本概念出发,深入探讨了其在现代应用架构中的实际应用,并结合代码示例,展示了云原生技术如何优化资源管理、提升系统弹性和加速开发流程。通过分析云原生的优势与面临的挑战,本文旨在为读者提供一份云原生转型的指南和启示。
19 3
|
7天前
|
网络协议 数据挖掘 5G
适用于金融和交易应用的低延迟网络:技术、架构与应用
适用于金融和交易应用的低延迟网络:技术、架构与应用
34 5
|
5天前
|
运维 Kubernetes Cloud Native
云原生技术在现代应用架构中的实践与挑战####
本文深入探讨了云原生技术的核心概念、关键技术组件及其在实际项目中的应用案例,分析了企业在向云原生转型过程中面临的主要挑战及应对策略。不同于传统摘要的概述性质,本摘要强调通过具体实例揭示云原生技术如何促进应用的灵活性、可扩展性和高效运维,同时指出实践中需注意的技术债务、安全合规等问题,为读者提供一幅云原生技术实践的全景视图。 ####