《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(6) https://developer.aliyun.com/article/1230988?groupCode=supportservice
3.2.2.3 云游戏技术服务
3.2.2.3.1 业务场景与核心技术
首先,云游戏涉及底层技术主要是vGPU,虽然vGPU的发展形态大部分为可控 的,但是最核心的GPU本身的源码依旧在相关GPU厂商手上,特别是当客户采用的 自研PaaS平台时,调度相关vGPU资源中涉及了大量关键链路,都需要与厂商交互, 作为技术服务的角色进入到一个vGPU场景中大部分时间会感到非常无力,会感觉是 在一层层做Proxy,但是实际真的是这样吗?
这也是本篇想说明的一些技术点,但是单纯得去讲技术点,可能很多看官并不能 理解这里面的深水区究竟在哪里,可以简单看下这张图:
其次,云游戏的技术维度跟视频直播产品有“异曲同工”之妙:一个是云游戏从具 体渲染能力的计算底层(VGP1Iaa1VM)捕获画面(这个画面来自于VGPU1VM运行真 实游戏所产生的),这就类似于直播“推流”,相关平台通过GPU厂商或系统厂商提供 的渲染类API进行捕获的动作,相当于视频直播的相关画面往“视频直播中心”推送的 过程;另外一个是,在捕获完成后做的封装动作也与视频直播产品转视频格式再合成 (比如M3U8切片TS合成MP4)类似;
最终decode到enduser的最后一屏上,这个最后一屏一般需要由云游戏客户端进 行拉取展示,其上的FPS值越高则代表游戏显示层面的顺畅度越高,那与视频直播产 品的帧率几乎一致。
3.2.2.3.2 技术服务关键角色
•渲染计算角色
核心渲染算力提供者,一般为超算(HPC)、GPU(物理GPU能力)、vGPU(虚拟化 GPU能力)等机型提供,会出现问题主要捕获阶段、落Log阶段与封装(encode阶段) ,同时由于与云平台耦合,所以在管控层面(装箱、调度、计算资源分配等)、虚拟化 性能分配(CPU算力分配、0进程争抢等)、GPU切分(如有)、前后端驱动(特别是host 端驱动)等方面也会经常出现问题,这次某云游戏专项中遇到的核心问题就聚焦在捕到的核心问题就聚焦在捕获阶段、落Log阶段、前端驱动、虚拟化性能、管控这几个 方面,在后面正餐中会具体提到。
•平台调度角色
核心PaaS能力提供者,一般分为自研与非自研,非自研领域属某手指、海某云 为代表的一些平台本次云游戏专项PaaS平台是由客户与某独立开发商配合一同研 制,所以在该角色上我们的沉淀并不多仅在排障渲染计算角色时了解到该角色主要用 在调度相关渲染计算节点并最终提供给玩家使用。
•最终玩家
如名所示,最终玩家指的是客户ToC部分的末端,在玩家与平台调度角色中还穿 插着一些网络角色比如加速节点调度、专线、图像传输等,最终玩家一般采用PC终 端进行游戏业务体验(部分厂商支持移动端)。
这三个角色是云游戏技术服务中体感最强的,同时也是日常排障中涉及最多的角 色(特别是渲染计算角色),由于本次专项涉及主要是端游,所以接下来讲的相关排障 技术点主要聚焦在端游上,对于手游,阿里云某某游客户会比较深的积累与沉淀,笔 者也很期待这次云游戏的客户能够衍生到手游云游戏,这样对于后续移动端云游戏就 有更深厚的积累。
《泛娱乐行业技术服务白皮书》——三、泛娱乐典型业务架构与场景——3.2 游戏类泛娱乐——3.2.2 游戏泛娱乐技术服务(8) https://developer.aliyun.com/article/1230985?groupCode=supportservice