《这!就是街舞》自由视角沉浸式体验黑科技揭秘

简介: 《这!就是街舞》第四季大家看了吗?不知道有没有小伙伴跟笔者一样,“DNA”都要跟着舞动了起来。除了炸裂的舞台,堪比跨次元的真实观影体验,让用户在自由视角视频体验效果下身临其境:

《这!就是街舞》第四季大家看了吗?不知道有没有小伙伴跟笔者一样,“DNA”都要跟着舞动了起来。除了炸裂的舞台,堪比跨次元的真实观影体验,让用户在自由视角视频体验效果下身临其境:

截屏2021-12-02 下午9.24.14.png

是不是觉得很炫酷,so 还不赶快上优酷体验一把!

 

自由视角视频作为优酷内一种新颖的观看模式,给用户带来了全新的观影体验,在对外的众多合作中作为优酷的亮点内容也引起了较高的关注度。然而随着产品声量的不断扩大,当前自由视角在整体的播放体验及投放链路上还有很多诸如,播放不流畅、内容不清晰、设备覆盖较低等问题需要优化解决。

 

基于此,优酷技术团队在上半年对自由视角进行了一次全面的优化升级。接下来的内容,我们将从全面优化升级的整体目标,围绕播放体验及用户规模展开,详解优酷播放器团队的整体优化策略及方案。

 


一、自由视角是什么

截屏2021-12-02 下午9.24.29.png

图1

 

上图1是自由视角视频每帧画面的样式,以下统一叫深度图

自由视角原理:自由视角视频是在原有播放链路的基础上,新增自由视角算法SDK对每帧深度图进行处理,生成指定角度的画面最终展示给用户。


二、客户端架构设计

截屏2021-12-02 下午9.24.38.png


这部分主要会介绍自由视角实现的核心逻辑。中间由两个虚线框隔开的两个模块左边是自由视角在播放器SDK中实现的逻辑,右边是针对自由视角播放体验优化的策略,优化策略在后面会做详细的介绍。

 

播放业务层:

1.   用户核心交互包括角度旋转齿轮(主要生成角度信息供算方侧使用)、自由视角视频用户提示、转场动画;

2.   通过开关控制做到线上功能可随时打开或关闭。

 

播放器中间层:主要包括两部分,一是中间层链路改造支持自由视角,二是下载自由视角视频所需要的算法文件,下载完毕以后将文件路径传给算法层使用;

 

播放器内核层:处理内核与算法层之间的数据交互,然后将算法SDK处理好的纹理数据合成以后直接上屏展示;

 

下载器:负责优酷点播和直播视频文件的下载,不用针对自由视角做特别的改造,主要是使用到了下载器的多分片下载功能提升下载效率;

 

算法:这层主要的职责是基于算法将深度图重建生成指定角度的画面。

 


三、自由视角性能优化方案


1. 方案调研


  • 优化方向首先我们得搞清楚为什么卡顿才能知道如何去优化。经调研,卡顿原因是由于播放器当前数据不足所导致的,播放器需要等待足够的数据以后才能继续播放,所以我们得出结论,提前下载数据、多通道下载、降低视频的码率从这三个方面入手就可以降低卡顿率;
  • 方案尝试:前期我们尝试了预缓存、视频流智能档、内核动态Buffer、多通道下载、自由视角动态降角度、播放器双实例切换降码率、连播预加载、过狂飙模式、视频AV1编码降码率共9种方案。在通过实际可行性调研后,最终确定预缓存、视频流智能档、内核动态Buffer、多通道下载这4种方案;


四、优化实践


技术侧优化

  • 卡顿率优化:

1. 视频流智能档

截屏2021-12-02 下午9.24.48.png


上图是智能效果示意图,智能档是根据智能档算法动态去决定下一个TS分片的码率,从而达到动态降低码率的效果;

截屏2021-12-02 下午9.24.57.png

智能档算法架构图

 

需要着重介绍的有这么几个点:

 

智能档控制器与数据源及其他模块的交互和控制:收集视频元数据和播放状态信息(比如缓冲区时长buffer)、网络信息,分片级别的码率/清晰度选择,清晰度切换控制,还有其它数据源链路上的事件响应和超时控制等;

 

策略引擎框架:支持多种策略实现运行的一个接口/环境/容器,每种算法策略实现根据从播放器内核和网络环境信息等输入,给定一个清晰度选择的输出;

 

数据链路闭环:客户端决策信息埋点上报,云端数据分析处理,优化后的配置更新或模型下发。其中,策略框架及各种清晰度选择的算法策略实现是整个智能档的核心灵魂,策略框架提供了一个平台,目前,优酷的智能档使用 ABTest 的方式支持了从基于各项离散规则到基于强化学习神经网络模型的多种算法策略的实现,这些算法可以根据配置或模型下发动态调整算法参数,互相对比优化,互相补充。

 

2. 内核动态Buffer

通过策略配置平台统一下发指定策略动态设置内核buffer大小,以达到最大限度利用下载资源的目的。

 

3. 多通道下载

截屏2021-12-02 下午9.25.06.png


如上图所示,多通道下载技术通过将每个独立的文件拆分成N个小块进行下载,每个小块对应右图一个下载通道,这样就可以通过多个通道并行下载,提高下载效率以达到降低卡顿的目标。

 

4. 预缓存

1)   实现可缓存播控信息和视频流文件;(如下图1所示)

2)   支持策略动态下发视频预缓存大小;(如下图1所示)

3)   自由视角能力大一统:将自由视角能力的配置统一收到播控后台,去掉客户端自由视角能力配置项,这样避免以后播控后台和客户端配置不一致导致产生不可预测的问题。(如下图2所示)

 

截屏2021-12-02 下午9.25.17.png

图1

截屏2021-12-02 下午9.25.30.png

图2

 

  • 场景覆盖度:

由于自由视角算法SDK支持两种渲染模式,基于DIBR的普通模式,以及关闭DIBR的切相机降级模式。在这个条件的基础上,对于性能不足可以良好支持DIBR的设备,通过降级模式进入自由视角,这在技术和产品角度都是可行的。

截屏2021-12-02 下午9.25.41.png

改造前

截屏2021-12-02 下午9.25.49.png

改造后


五、数据对比 & 效果


播放体感优化效果:

截屏2021-12-02 下午9.26.07.png


优化前

截屏2021-12-02 下午9.26.23.png

优化后

 

业务&技术优化效果:

街舞4自由视角视频(一个月)相较于去年同期街舞3点播总播放量提升近2倍。流畅度提升近70%。

 

场景覆盖收益:

 

1.  并不是所有的低端机型都可以支持自由视角的降级模式,因为场景特殊,算法要求的视频输入源的清晰度需要不低于4K,因此处于【4k解码, 支持DIBR】区间的设备才属于本次优化预期提升的范围;

2.  通过这次新增的降级渲染技术改造,新增覆盖近3成低端机型,最终总覆盖度从原来5成(仅支持中高端机型)提升至近8成;

 


六、总结

为用户提供更优质、更丰富的观影体验一直是我们优酷秉持的目标,也是我们持续不断探索和尝试的动力。如何让用户感受到技术的温度,而不是仅仅看到的是冰冷的字面和数字上的提升,让更优质的体验是用户切身能感受到的,这是我们未来的努力的一个方向。同时我们也在打造直播自由视角,竭尽所能的去探索更多更新的观影方式

相关文章
|
12月前
|
机器学习/深度学习 编解码 算法
高真实感3D高斯数字化身
本次分享介绍了3D高速扩建高新作为一种新的可微渲染技术,特别是高斯泼溅技术在数字化身3D领域的应用。该技术通过高斯点云扩展传统3D点云属性,实现高真实感、实时交互渲染,优化3D重建与多视点图像生成。文中还探讨了数字化身的构建与应用,包括全身和人头模型的创建,并展示了其在不同环境光照下的效果。最后,提出了未来研究方向,如更灵活的编辑和视频生成大模型的融合,以提升数字人的可控性和真实感。
|
10月前
|
机器学习/深度学习 并行计算 API
Qwen2.5-1M: 支持100万Tokens上下文的开源Qwen模型
两个月前,Qwen团队升级了 Qwen2.5-Turbo,使其支持最多一百万个Tokens的上下文长度。今天,Qwen正式推出开源的 Qwen2.5-1M 模型及其对应的推理框架支持。
1995 28
|
机器学习/深度学习 数据采集 运维
基于机器学习的智能运维:提升系统稳定性与效率
在数字化时代,随着企业对信息技术系统的依赖日益加深,传统的运维模式已难以满足现代业务需求。本文探讨了如何通过机器学习技术优化运维流程,实现故障预测、自动化处理和性能优化,从而提升系统的稳定性和效率。文章首先概述了智能运维的概念及其重要性,随后深入分析了机器学习在故障检测、自动化运维和性能优化方面的应用案例,并讨论了实施智能运维时面临的挑战及应对策略。最后,通过数据支持的分析,展示了智能运维带来的效益,为运维领域的专业人士提供了一种前沿的技术视角和实践指南。
463 27
|
安全 网络协议 关系型数据库
最好用的17个渗透测试工具
渗透测试是安全人员为防止恶意黑客利用系统漏洞而进行的操作。本文介绍了17款业内常用的渗透测试工具,涵盖网络发现、无线评估、Web应用测试、SQL注入等多个领域,包括Nmap、Aircrack-ng、Burp Suite、OWASP ZAP等,既有免费开源工具,也有付费专业软件,适用于不同需求的安全专家。
2163 2
|
存储 弹性计算 固态存储
三分钟磁盘存储性能IOPS、I/O及吞吐量指标详解
什么是磁盘I/O?存储IOPS是什么?磁盘性能指标吞吐量是指什么?
17791 39
|
Kubernetes Java Android开发
用 Quarkus 框架优化 Java 微服务架构的设计与实现
Quarkus 是专为 GraalVM 和 OpenJDK HotSpot 设计的 Kubernetes Native Java 框架,提供快速启动、低内存占用及高效开发体验,显著优化了 Java 在微服务架构中的表现。它采用提前编译和懒加载技术实现毫秒级启动,通过优化类加载机制降低内存消耗,并支持多种技术和框架集成,如 Kubernetes、Docker 及 Eclipse MicroProfile,助力开发者轻松构建强大微服务应用。例如,在电商场景中,可利用 Quarkus 快速搭建商品管理和订单管理等微服务,提升系统响应速度与稳定性。
504 5
|
机器学习/深度学习 供应链 算法
【2023高教社杯】C题 蔬菜类商品的自动定价与补货决策 52页论文及代码
本文提出了一个基于动态规划的蔬菜补货和定价策略,通过分析蔬菜品类间销售量的分布规律和相互关系,利用多元回归、随机森林、灰色预测等方法预测市场需求,并建立数学模型以最大化商超收益。
449 0
【2023高教社杯】C题 蔬菜类商品的自动定价与补货决策 52页论文及代码
|
NoSQL Java 关系型数据库
软件开发常用之若依修改之添加数据库,添加redis,利用RDM连接宝塔
软件开发常用之若依修改之添加数据库,添加redis,利用RDM连接宝塔
|
存储 编解码 vr&ar
色彩空间与像素格式
颜色是不同波长的光对人眼刺激产生的色彩感觉。色彩空间(Color Space)是颜色的数学表示,根据不同的表示方法分为不同的色彩模型。最常用的色彩模型有三类:RGB(用于计算机图形学), YUV(用于视频系统), CMYK(用于彩色印刷)。后文对色彩空间与色彩模型的叫法不作区分。本文仅讨论视频图像处理领域常用的 RGB 色彩空间和 YUV 色彩空间。
3280 0
色彩空间与像素格式
|
数据可视化 关系型数据库 MySQL
Apache Superset 1.2.0教程 (三)—— 图表功能详解
通过之前章节的学习,我们已经成功地安装了superset,并且连接mysql数据库,可视化了王者英雄的数据。使用的是最简单Table类型的图表,但是superset还支持非常多的图表类型。 本文我们将对各种图表类型进行逐一的演示,文章较长。
1343 0
Apache Superset 1.2.0教程 (三)—— 图表功能详解