超越感官,沉浸赛场——大型体育赛事云上实战精选-第三章 2022北京冬奥会:百年奥运的黑科技-百年奥运的沉浸其境:冰雪之外,与你同在—“互动虚拟演播”(下)

简介: 超越感官,沉浸赛场——大型体育赛事云上实战精选-第三章 2022北京冬奥会:百年奥运的黑科技

2. 三项国内首个突破性超级能力—业界尖端技术

 

能够在此次冬奥会实现创新方案落地,打造实时互动的沉浸式赛事报道,源于阿里云视频云在虚拟演播厅产品上的深度打磨和三点战略性的技术突破:

 

 

 

国内首个纯云端实景抠像合流技术

 

此次的互动虚拟演播方案,是针对冬奥会打磨的新实景抠像算法与引擎能力,它第一次采用实景预设背景抠像,第一次采用多机位切换抠像,第一次采用4路抠像源(绿幕+实景)同时实时抠像处理。

 

众多“第一次”带来的价值是,满足了冬奥会级别的世界顶级赛事直播要求,将实景抠像效果达到业内天花板水平

 

对标广电级别的节目要求,阿里云视频云正是利用算法打破技术壁垒,通过尝试多种算法和工程模型,一次次突破自我,提升实景抠像的效果和性能。在各种采访环境不可控的杂乱背景下,技术均可处理得非常完美,让冬奥的赛外内容播报体验极大提升。

 

国内首家“端云无缝衔接”的导播平台

 

在此次冬奥会中,互动虚拟演播厅首次打通了RTC和GRTN网络,将多机位、多视角实时同步技术能力,与RTC实时连麦、异地开播能力进行结合。

 

一般情况下,导播台是一直缺乏端侧能力的,于是无法实现实时互动场景,虽然也可以尝试和内外部各种App应用联合,但因为种种原因很难真正落地。

 

此次阿里云视频云RTC技术结合了导播台,进行虚拟演播厅产品的深度改造和联动,并且对App端的界面效果和性能完成全面优化,为普通用户提供了简单、稳定的连线功能,真正实现了“互动虚拟”演播能力

 

业界广电级导播能力

 

全新的互动虚拟演播厅,全面满足超低延时、超稳定、超高并发的特性,达到广电级导播能力

 

从连麦APP端到导播合流输出全链路超低延时,实现连麦端实时通讯、导播台“抠像+合成渲染输出”,最快2-3S内即可完成所有流程。在多人、多地同时开播、长时间连线开播情况下,对多背景抠图的处理场景可以达到稳定处理零断流的效果。整个方案落地,可经受住大规模的分发、观看的考验,对超高并发依旧稳定出色。

image.png

“互动虚拟演播厅”制作全链路

 

在东京冬奥会,阿里云视频云的虚拟演播厅就曾进入奥运村。当时,身处日本东京和中国北京两地的企业代表,通过云导播台的虚拟演播厅、实时字幕等能力,顺畅完成沉浸式直播连线。

 

2022北京冬奥,为了结合CGTN的记者采访和报道场景,同时满足央视记者深度沉浸式报道的观感,阿里云视频云重点对互动虚拟演播方案,进行几个方面的深度升级:

 

第一,重点对实景抠像打造了新的算法引擎和极致效果,解决了实景抠像边缘粗糙,抖动等问题,抠像效果精细到人物发丝,真实细腻的效果促进了产品的可应用性,打破行业实景抠像壁垒。

 

第二,丰富了云导播在场景端侧的接入能力,实现“实时互动+导播”的完整方案,打造了“实时互动”场景,并且,通过App端简单便捷的开播,让使用门槛非常之低,从而高度满足了电视台记者群体的使用诉求。虚拟演播厅强化增补了前链路的推流互动环节,更进一步实现了沉浸、实时的直播体验。

 

第三,全面升级导播稳定性、超长时间连麦稳定性、抠像稳定性、音视频互动App性能等,从而全方位满足异地、多人、多场景、超长时间的连麦和直播需求,对于复杂的多场景(单人/双人、远景/近景、直播中插垫片)实现无缝切换,真正达到广电级别的节目制作水准。

 

全面的技术升级,将“虚拟演播厅”升级为具有实时互动沉浸效果的“互动虚拟演播厅”产品方案,从而为2022冬奥会带来赛事报道的全新体验。

 

3. 互动虚拟演播的更多空间—更多场景价值

 

北京冬奥会谢幕之后,互动虚拟演播还会支持残奥会的实时沉浸连线播报。奥运会这样的超级赛事打磨了技术方案,让其不仅服务于此。

 

作为全新的云导播实时互动虚拟演播技术,互动虚拟演播厅可以通过低门槛地使用音视频互动App,以发起直播与实时连线互动,同时,基于云端抠像与虚拟背景合成的能力,提供“端到云到端”的虚拟演播解决方案,从而打造沉浸式直播体验。

 

它是专门为远程互动打造,实现虚拟直播间的沉浸体验。此外,也为远程制作、异地互动直播的场景提供解决方案,如身处在滑雪场的运动员可以和新闻中心的主持人进行异地的虚拟合屏,并可进行实时互动采访。

 

从实际的应用场域,不仅支撑体育竞技、国内外赛事类的现场转播、远程解说、多主持人模式等场景,互动虚拟演播厅还可落地于更多行业场景,如电商与活动的直播支持、会议的多模式转播,以及各种类型的异地连线与虚拟访谈,场景广泛,能力丰富,均可实现。

 

image.png

总言之,基于2022北京冬奥会的实践与沉淀,阿里云视频云会将互动虚拟演播解决方案进一步深化为更强的产品力输出,面向涉及直播场景的各行业提供远程开播、虚拟直播间的解决方案

 

从后继发展来看,在技术升级和产品优化上,“互动虚拟演播”会围绕三个方向继续演进突破

 

首先,在实现了低门槛接入之后,更强调实现持续降本,提升整个产品性价比和竞争力

 

再者,加强完善端侧布局,丰富导播互动能力(如观众端播放画面的返送等),从而提供更完善的互动虚拟演播方案。

 

在此之外,在物理与虚拟世界穿梭构建的大趋势之下,将深度结合“虚拟演播厅”的概念,探索虚拟人、3D背景等能力的结合与落地,打造虚拟直播间的更多可能。

 

未来的互动虚拟演播,技术更前瞻,门槛更低简,场景更丰富,互动更多元,效果更沉浸。借冬奥之光,技术普惠就在眼前。

 

 

发布时间:2022年2月20日

作者:IMMENSE

 

 

 

相关文章
|
8月前
|
数据采集 监控 前端开发
建议用API来获取电商的商品数据,但还是需要用爬虫
在电商数据获取中,“优先用 API、辅以爬虫”是务实策略。API 满足合规稳定的核心需求,而爬虫则在权限限制、数据不全、成本过高或跨平台整合时发挥关键补充作用。本文从 API 局限性、爬虫不可替代场景及协同方案三方面,详解如何高效结合两者,实现合规又全面的数据采集与应用。
|
10月前
|
JSON Java 定位技术
抖音虚拟位置修改器,快手小红书陌陌均支持,jar最新xposed插件
这个代码实现了一个GPS位置模拟器,主要功能包括: 基于基准位置生成随机GPS坐标点
|
机器学习/深度学习 缓存
Block Transformer:通过全局到局部的语言建模加速LLM推理
Block Transformer是一种优化自回归语言模型推理效率的新架构,通过块级自注意力来平衡全局和局部依赖,提高吞吐量。模型包含嵌入器、块解码器和令牌解码器,其中块解码器处理全局依赖,令牌解码器处理局部细节。这种方法减轻了KV缓存的延迟和内存开销,尤其是在长序列处理中。实验显示,尽管Block Transformer参数量增加,但推理速度显著提升,尤其是在大块长度和优化的组件比例下,实现了性能与速度的平衡。
824 7
|
Java 测试技术 C#
浅谈 C# 13 中的 params 集合
浅谈 C# 13 中的 params 集合
301 5
|
机器学习/深度学习 算法 数据挖掘
提高时钟置换算法的性能
【10月更文挑战第25天】通过上述一种或多种方法的综合应用,可以在不同程度上提高时钟置换算法的性能,使其更好地适应各种复杂的系统环境和应用场景,提高虚拟内存管理的效率和系统的整体性能。
421 62
|
机器学习/深度学习 测试技术 知识图谱
DeepSeek-R1:Incentivizing Reasoning Capability in LLMs via Reinforcement Learning论文解读
DeepSeek团队推出了第一代推理模型DeepSeek-R1-Zero和DeepSeek-R1。DeepSeek-R1-Zero通过大规模强化学习训练,展示了卓越的推理能力,但存在可读性和语言混合问题。为此,团队引入多阶段训练和冷启动数据,推出性能与OpenAI-o1-1217相当的DeepSeek-R1,并开源了多个密集模型。实验表明,DeepSeek-R1在多项任务上表现出色,尤其在编码任务上超越多数模型。未来研究将聚焦提升通用能力和优化提示工程等方向。
886 16
|
编译器 Linux 开发者
.so文件反编译
【6月更文挑战第22天】.so文件反编译
1156 56
|
Java 编译器 C语言
learn_C_deep_12 (深度理解“取整“、“取余“、“取模“运算、掌握运算符优先级 )
learn_C_deep_12 (深度理解“取整“、“取余“、“取模“运算、掌握运算符优先级 )
924 0
learn_C_deep_12 (深度理解“取整“、“取余“、“取模“运算、掌握运算符优先级 )
|
存储 安全 小程序
什么是云计算,为什么选择阿里云?
阿里云提供的云计算服务让您能以按需、按量的方式获取算力,涵盖计算、存储、网络等多种形态,无需自建数据中心。它具备弹性、敏捷、安全、稳定、高性能和低成本等优势,支持业务快速创新,保障数据安全及业务连续性,帮助您专注于核心业务发展。常见应用场景包括网站、小程序、移动应用及大模型问答机器人等。
692 1
|
传感器 监控 搜索推荐
量子科技在医疗领域的应用?
【8月更文挑战第4天】量子科技在医疗领域的应用?
977 1