开发者学堂课程【云上视界断无限2028里云直微峰会:云上“视界”创新无限|2022阿里云直播峰会】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/778/detail/15728
云上“视界”创新无限|2022阿里云直播峰会
第二个点就是容灾的问题,大规模用户的背后一定是对应着复杂的系统,我们在做系统设计的时候,除了要考虑到合理的层级设计的内聚高耦合之外,还要考虑到如何应对特殊极端情况的发生,比如直播热点的突发局部服务的故障,网络故障DNS的异常等等,这些都给我们带来极大的技术挑战,在技术和平台,实现方面我这里重点说明一个就是聚合CDN刚才提到的容量和容灾的问题也要求我们要把更多的直播试听进行聚合服务,这里我们会把火山引擎直播CD与行业友商的CDN进行聚合在进行统一的CDN调度,在调度层面重点实现规则调度节点优选策略引擎容灾平台以及CDN的管控,总之聚合CDN平台,一方面解决容量储备的问题,另一方面配合调度系统,让我们面对局部的问题突发的问题均可以快速的处理,并且具有通络的能力,这里就有效的解决了稳定性的基本问题。同时我们再配合端上的SDK语句和CDN的调度系统配合,把两者之间的实时数据采集监控。能力策略进行有效的串联给到数组抖音app稳定的直播能力,目前整个的SLV的指标达到四个九。
第二个核心就是直播的质量,我们一直强调的是用户体验,如何用技术的手段助力业务的增长。相信大家在过往的分享中也看过类似的总结,首先还是QoS的指标,这里我列了一下常规项包括推拉流程功率、卡顿、画质、音质端到端的延时,如果下沉到二级指标,还包括守真时间、音画同步率、而返延时、功耗等等。这里我没有完全列全,如果细化下来的话,大概有几十种不止。而现在每一项都会有专门的同学在持续的去优化指标。但你会发现一个问题,当我们优化到指标到一定水位线之后,会面临出现指标和指标之间存在相互制衡的关系。这里面最大的挑战就是如何在这些指标之间去做平衡找到最优解。比如画质可能就跟卡顿之间是矛盾的,清晰度和功耗,卡顿和延时等等,也会面临同样的问题。在抖音的实践中,我们也发生了思路的变化,一切以提升用户体验作为我们的目标。从单纯的KOS的指标到KOE的AB实验作为我们技术验收的标准,从这张表中,大家可以看到我们更关注的是直播用户的QE的数据,包括看波渗透看播时长人均评论的渗透等等。同时用一定规模的对照组和实验组数据来做比较保证数据量级的可信度,在过往的技术迭代优化中还是取得了不错的收益,比如说在过往的音量均衡降低,延时超分等等都取得了不错的进展。
这里呢,我还想提到一点就是关于策略产品,这也是我们做的重要的一件事情,你会发现我们做了大量的app实验,但我们最后沉淀下了什么呢,尤其是抖音可以使用,其他的业务情况一样吗,抖音使用的策略,其他的用户也同样适配吗,情况其实是不一样的,这就要求我们把分散的能力与用户场景做策略的适配给到用户最匹配的直播能力的组合,这也是我们策略产品重点要解决的问题,这里我给大家展示了一个初步的一个模型,后面有机会会跟大家一起做深入的讨论。第三项成本,这也是大家非常关注的问题,尤其是直播的流量越来越大,直播带宽成本已经在业务总成本中占有非常高的比重,我们如何利用技术的手段找到成本优化的可能性,这也是技术价值的关键体现。
在抖音规模化后,直播的成本逐年增加,那么我们面临的挑战是直播人问与体验如何找到最优解,或者能不能只降成本,不损伤用户的体验。另外呢我们在做技术优化的时候会面临拐点的问题。当越过一个拐点,我们需要一个LY的度量的手段。关于成本的时间,这里我从两个方面做一个总结。第一呢是基础的手段,这也是研发同学能够直接参与的方式。在过往呢我们把错峰调度起波策略,优化全链路高清低码。 其实这就是用算力来换带宽,整个的LY是能够算的很清楚的节点复用等技术作为重点依然坚持的体验与成本兼顾,并且取得了不错的效果。第二是用商务考核的手段,虽然这不是研发同学直接参与,但是价格作为直播CDN的关键考核项也会占有一定的比例,研发在这个过程之中呢,重点支持数据的校准、考核标准的支持。没有量化就没有优化所有总结的方法,我们在过程之中定义了万分钟直播单价作为我们迭代的oi的口径与业务侧对其一切优化手段用这个指标来度量。
这张表是去年优化的数据,整个的效果还是取得了不错的进展。最后做一个总结对应开头提到的变化与不变直播技术本质不变的内容,我们在抖音的实践中,坚持从稳定性、用户体验、成本三个维度作为我们核心关注的锚点持续的迭代和升级,希望找到不同时期的最优解。
有了指导的原则,具体到实操的环节,我们也建立了聚合直播CDPK的平台,在这个平台里会有详细的准入标准以及放量的机制,同时PK机制公开透明系差的话会涉及到服务质量、可用性打分、响应时效、资源储备、商务单价等多个维度,这样就可以让整个聚合直播CD进入到了多维度良性绩效PK的模式,进而来支持我们前面提到的稳定性体验和成本之间的最优解。
感谢周一男的精彩分享,每天抖音平台上都有海量的用户在观看直播,这背后离不开直播技术的突破与创新,下面有请优酷直播负责人戴洵为我们分享大型活动直播沉浸式体验的技术解密。
大家好,我是戴洵来自优酷技术部,现在在负责直播相关的基础工作,那今天给大家带来的分享的主题呢,主要是优酷在沉浸式直播技术上的一些记录事件。我会给大家分享一些我们这些年看到的一些用户需求以及我们跟创作者一起去做的一些新的直播体验那以及这些直播体验背后的一些技术方案。
优酷是一个长视频平台上面有很多大型的直播内容,那近两年我们在工作中发现直播在供需上是有一些变化的,第一个变化的话是大型的这些现场节目的需求,正在从线下往线上去溢出,比如说我们去年做的山河令的主题演唱会,还有包括乐华的12周年的演唱会,那线下的几万张门票基本上都是被秒杀的那很多抢不到票的用户只能去线上去观看第二个变化的话就是用户越来越愿意为这个线上的这个直播去付费那前面提到的这两场演唱会线上的这个直播收入是线下直播收入的几倍,第三个变化是用户其实更愿意为沉浸感的内容买单,比如说我们去年的这个街舞似的总决赛那明星的这个特写的这种单独的受视角的售卖效果也是非常好的。既然用户端有这种需求,作为平台和创作者其实也更愿意去做线上的沉浸感更好的内容,那比如说头部的经纪公司乐华还有头部的这个中医制作公司灿星,他们都愿意去尝试向多视角自由视角这种技术。体育赛事像CUBA,他们也愿意在这个全明星赛里面尝试,只有像国家大剧院这种国家级的艺术殿堂,在十四周年的这个特别节目里面也在尝试着XR直播,今天我会重点跟大家分享一些刚才我提到的一些像多视角、自由视角、XR直播这三种直播技术以及这些技术在优酷里面的应用场景。
那首先我们来先看几段视频来感受一下这三种直播技术。
那这段视频的话就是街舞是冠军之夜用的都视角的技术,他是都市角是允许这个用户结合大小屏的这种情况,然后让用户可以同时观看多个画面,不仅可以通过主画面看主舞台,也可以通过小画面去看每一位明星导师的特写,这是多视角的一个体验。
这段视频是CUBA全明星赛在使用自由视角技术。自由视角给用户更多的自由度,用户可以在正负75度的范围内自由的选择角度去观看,切换精度也精确到一度,这种3D的视频往往需要很大的码率,但是我们做了优化这里不会引起卡顿的。
这段视频是国家大剧院在十四周年特别节目里面使用XR技术做的直播。首先XR是可以让真实的五折完全融入到一个虚拟的空间中,虚拟的空间中布局也有虚拟的背景也会叠加虚拟的前景,光影的效果也会比传统的绿幕的虚拟技术更加自然一些。
下面我就把多视角给大家展开做一个介绍,多视角在优酷的应用产品还是比较多的,像演唱会类、晚会类的、体育类的。第一个版本其实没法做到多画预览,在体验上还是存在很多挑战的,当时能想到最简单的方案就是拉路流,但是拉路流会占满带宽,会导致卡顿率的飙升,拉路流不太容易做实验轴的对齐。
所以第一个版本还是给直播间给每一路流增加了一个按钮,切换流的时候点击按钮去重新刷新播放区去换,这样就会带来第二个问题就是每次切换都会重新缓冲数据。这种体验其实还是有点不爽的,同时重新加载还会带来另外一个问题就是时间轴回跳,因为大家都知道互联网的视频,为了做压缩所有的视频都是按主来进行的,也就是GOP。解码的时候也是从GOP的第一帧开始解,如果在这中间进行切流那只能从最近一个GOP的第一帧开始播,给人的体感就是同一个舞台多个视角切换流之后就会往回跳几秒,这种体验。
下面这张图,是在视频演示里的技术方案的一个完整链路,他就做到了这种平滑的切换,可以同时去预览,然后切换速度是非常快的。这个方案里面的话一共包含四个部分,包括现场、中心、中心云、边缘云,还有最终的端。从现场包括制作系统和编码系统两个部分,这个系统一般这个异常演出的话都有多个机位。每个机位都会把信号输出给导播台。
导播台有导播人员最终把这些信号就是从这个导播,从节目和播出的信号,这个信号叫PGM信号。那因为要做多视角直播,所以说的话不仅要把PGM信号给到编码集群,也要把每一个机位的信号也要给到编码。那编码集群的话会对这些。信号进行编码,并且上传到云上。必须要强调的一点的话就是编码机。
这个时间戳是提前对齐的那在推流的时候,会把堆积的绝对实验出来,加到这个流的meta data。那推到云中心之后的云中心的话是使用了阿里云的一款云导播的产品,这款产品主要的用途,首先是根据流里面的卖卡的卡对多个视角的流进行针对企业,第二个作用是把那个每一路视角大小画面的关系给枚举出来。
就像这张图上所示的一共包括两个视角,第一个视角的话是主舞台视角,第二五第二个视角的话是黄渤的特写的视角。多视角服务的话,就会把这个云导播拼接下来的每一路流都下载缓存起来,那当接收到端侧的切流服务器刘新令之后,就会把相应的音视频的数据切换过去,使用低延时的RTP协议发给端侧进行渲染。之所以要把这个都市交流步骤边缘,主要是为了离用户更近一些结合FTP协议做到更低的延时,从而提升了整个气流的体验,同样的跟云导播一样的多视角的服务也是需要把多个视角的流,通过绝对的时间戳进行去做对齐。最后就是端侧的交互式的播放器,在收到流之后进行解码拆分画面,并且渲染成这种可交互式的这种播放器,这就是一个完整的链路。