体验不尽,进化不止,看视频云技术六大创新

简介: 2022云栖演讲精粹系列-1
人类的体验欲望不止,从而促成了视频的发展史。

当前,整个社会进入视频化时代,视频被广泛地应用于社会生活的各个领域,相比图文,视频拥有更大的信息密度。

视频实际上并不是一个简单的技术,是交叉学科创造的技术领域,如:云计算,网络,编解码,人工智能等。

阿里云视频云围绕着视频的全链路生命周期,提供云边端一体的数智化音视频能力和全链路的解决方案

视频全链路,是指从视频的采集、生产、处理、传输、分发到消费(播放),它的底座一定是基于云的,不管是云边一体,软硬一体,还是云端一体。

经过长年的技术积累和应用实践,视频云构建了从内容生产到内容消费的端到端技术架构和服务能力,为用户提供更低延时、更高清、更高效、更沉浸的体验

3.jpg

无限演进:超高清、超低时延

体验的无极限演进,让编解码与超高清、与数据量、与算力的三大矛盾涌现。

需求的演进,让两大视频技术趋势不可忽略,一是超高清技术,二是视频超低时延技术。

  • 视频超高清技术

视频清晰度从SD,或者说480P,到Full HD,也就是所谓的1080P,两者之间信息量扩大了将近7倍,然后又发展到4K,8K,每一次的升级实际上都是视频数据量爆发式的增长

图片 3.png

沉浸体验要求高分辨率,高帧率,宽色域

目前,视频帧率使用较多的是24帧、30帧,但VR视频需要60帧甚至120帧才能带来沉浸式的体验。

清晰度的提升,帧率的提高,会带来更好的高运动场景体验。

然而,沉浸体验的AR、VR,所需的信息量大概是7000x7000分辨率,比我们现在使用的8K还要大。

可以想象,未来视频场景带来的将是信息量的急剧增长。

图片 4.png

视频高帧率的发展趋势

这中间,会导致三大矛盾的激增:

编码升级周期 VS 超高清需求的矛盾

如此海量的视频数据需要压缩,但是视频编码平均十年才升级一代。超高清的需求可能十年已经升级了四五代,但是编码器才升级一代。

编码压缩率 VS 数据量增长的矛盾

每一代新的编码器性能大概提升50%,相当于压缩力多一倍,但是从Full HD到8K,再从30帧到60帧,是72倍的信息量增长。编解码的升级远远达不到视频信息量升级的要求。

编码复杂度 VS 算力增长的矛盾

每一代编码的升级复杂度大概要提高100倍,但随着摩尔定律的逐步失效,算力的增长很难做到18个月就升级一代。

只有把更多的算力,不管是边上的算力,端上的算力,还是云上的算力集中起来,才能够满足用户极致体验的需求。

  • 视频超低时延技术
视频的发展历史,就是延时发展的历史。

从最早的PC直播,到长视频网站的出现,再到淘宝直播的风靡,整个视频的趋势实际上是视频延时降低的趋势。

视频从30秒延时的可传播,逐渐发展到到可广播、可互动、可沟通、可操作、可沉浸。可以说,每一次的升级都是视频延时的不断降低。

而且,我们可以越来越清晰地看到,视频延时是在急速下降的。延时从30秒到10秒可能经历了很长时间,但目前已经到达了百毫秒以内,准确来说是五六十毫秒的水平。

云边端协同,构成了更低延时的极限突破,让真正的沉浸成为可能。

4.jpg

云边端一体的视频云技术框架

视频的每一次升级,对于基础网络和算法之上的整个基础设施,都是一个巨大的挑战。视频技术天然是一个云原生的技术,只有基于云原生,才能让视频技术的规模做大,而用户强体验、低延时的需求带来的成本问题也需要基于云边端协同解决。

云最大的作用就是带来弹性。

任何的资源,任何的直播,流量都是会变化的,所以这种弹性的能力,不管是在边缘云还是中心云上面,对于视频来说都至关重要。

视频永远在追求低成本、高效能、高质量,而边缘云则为视频技术的发展提供了一个非常好的平台。

基于2800多节点的就近分布,边缘云缩短了第一公里和最后一公里,能够降低传输的延时,同时它带有算力,能够降低算力的延时,最终推动着用户的体验不断升级。

运用边缘云、中心云,再结合端,例如手机,可以作为天然的算力分布的设备,阿里云视频云搭建了云边端一体的视频云技术框架,提供一个服务化的平台,以PaaS,SaaS,SDK等各种形式更好地服务客户。

5.jpg

六大创新应用

从最早的数据跟着算力走,到现在算力跟着数据走。只要有数据的地方,就有算力。
  • 超低延时直播RTS

边缘云不但可以缩短物理的接入,同时能够满足算力的需求。

视频云超低延时直播RTS,已全面应用于手淘双十一,从单边直播到RTC技术,再到超低延时直播技术,极大帮助手淘提升自身业务价值。

目前RTS 2.0平均延时达到200毫秒,基本上跟普通视频通话的时延持平,但在成本上会大幅降低。未来低延时直播也会应用于更多场景,让用户获得更好的体验。

6.jpg

  • 云渲染:超普惠超体验技术

延时可不可以更低呢?是可以的。

云渲染技术,利用「串流」的技术,实现50-60毫秒的延时。不管是云游戏,云渲染,虚拟世界都是通过视频流化带给大家沉浸体验,即需要使用「串流」技术。

串流技术比较复杂,虽然五六十毫秒的延时是非常低的,但仍然可以将延时分为物理的延时,编解码的延时等等。

实际上需要在视频的每一个环节中,编码、网络QOS、云端处理、传输等都要做大量的技术创新和突破,才能够真正做到五六十毫秒延时的水平。

今年六月,央视三星堆奇幻之旅使用了阿里云视频云的串流技术,以普惠方式让每个人都能物理“穿越”至考古现场。云渲染与串流技术一定会不断演进,未来的应用场景也会越来越广。

图片 8.png

  • 虚拟演播:低门槛实时沉浸互动

有了网络和算力的支持,越来越多专业化的内容,也能够进入到普通直播。视频云基于深度学习算法的实时、实景抠像技术,支持了东京奥运会、北京冬奥会的直播需求,在不能物理碰面的情况下,通过导播台多机位、实时连麦、异地开播能力,实现主播与多层虚拟背景完美融合。

利用云端的算力与网络能力,仅需两部手机和一台电脑,视频云就可以把以往需要专业制作能力的视频,直接搬到我们的现实生活中。

7.jpg

  • 云剪辑:智慧高效的美学生产

同样,我们也可以在云端进行各种各样的剪辑。通过云剪辑技术,实现多端统一、端云一致的视频播放效果。

即使是在最传统的多图片场景下,我们也可以应用模板工厂,通过一些简单的AI算法,实现类视频化及批量化生产。

视频的世界不是一蹴而就的,而是一步一步发展而来。可以看到,视频技术在生活生产的各个方面都发挥着巨大作用。

  • 智能媒资:泛媒体的全智能管理

智能媒资基于边缘云技术,对视频进行理解、搜索、打标,将视频作为一种资产来管理。

在企业IT数字化的背景下,智能媒资让视频可以像文字、图片等信息一样被检索。

结合边缘云的算力、网力、存储等,智能媒资利用了大量的AI技术,把媒资体系带到离业务更近的地方,实现云+边泛媒体资源池的高效组织与智能管理。

8.jpg

  • 8K VR:全视角沉浸的挑战

在 VR 领域,不管是国外已经超过1000万台销售量的Quest 2,还是国内Pico这样的设备,实际上面临着更大量的数据处理,因为它们至少是8K清晰度,这对编码技术和播放器技术是非常大的挑战,例如全视角推流,划分tile,编码大小流配合,视角的预测等。

阿里云“云边端一体化”的视频云技术,对带宽的要求低,降低了成本,同时扩展性好,支持更高清晰度的场景,能够达到用户更极致的体验要求。

9.jpg

万物互联时代,视频已经到了一个真正可以为用户体验升级带来爆发的阶段。

未来,更多的业务与场景将会融合,更为专业的制播能力将全面云化,视频将朝着实时化,互动化持续加速,为用户带来更低成本、更高质量、超沉浸式体验。

O1CN01FmuEaM1WvnyduDEi7_!!6000000002851-2-tps-1400-136.png

相关文章
|
SQL 人工智能 分布式计算
基于阿里云PAI平台搭建知识库检索增强的大模型对话系统
基于原始的阿里云计算平台产技文档,搭建一套基于大模型检索增强答疑机器人。本方案已在阿里云线上多个场景落地,将覆盖阿里云官方答疑群聊、研发答疑机器人、钉钉技术服务助手等。线上工单拦截率提升10+%,答疑采纳率70+%,显著提升答疑效率。
|
2月前
|
JavaScript 前端开发 NoSQL
Node.js 后端开发全解析:从核心原理架构到实战应用
本文系统解析Node.js核心原理(V8+libuv、事件循环)、后端分层/MVC架构、Express/NestJS实战案例,并客观分析其高并发优势与CPU密集型短板,助力开发者精准选型与高效落地。(239字)
409 2
|
4月前
|
机器学习/深度学习 人工智能 自然语言处理
AI时代的“义务教育”:深度拆解LLM预训练核心原理与PyTorch源码实现
本文深入解析大模型预训练核心,以Qwen2.5为例,从Tokenizer、RoPE位置编码到GQA注意力机制,拆解LLM如何通过海量数据“炼”成。涵盖架构演进、关键技术与代码实现,带你手把手理解大模型“义务教育”阶段的底层逻辑。
346 7
|
7月前
|
存储 监控 算法
117_LLM训练的高效分布式策略:从数据并行到ZeRO优化
在2025年,大型语言模型(LLM)的规模已经达到了数千亿甚至数万亿参数,训练这样的庞然大物需要先进的分布式训练技术支持。本文将深入探讨LLM训练中的高效分布式策略,从基础的数据并行到最先进的ZeRO优化技术,为读者提供全面且实用的技术指南。
741 2
|
12月前
|
存储 SQL 关系型数据库
MySQL存储引擎简介
在选择相应的存储引擎时,需要充分考虑实际业务场景、性能需求和数据一致性要求,从而为数据管理提供最佳支持。
522 17
|
机器学习/深度学习 人工智能 缓存
AI智能体研发之路-模型篇(二):DeepSeek-V2-Chat 训练与推理实战
AI智能体研发之路-模型篇(二):DeepSeek-V2-Chat 训练与推理实战
2586 0
学生0元购|低配也能畅玩!《黑神话:悟空》云电脑攻略
《黑神话:悟空》正式上市,这款备受期待的游戏对电脑配置要求不低,但通过云电脑,你无需担心硬件限制,随时随地畅玩大作。最低仅需1.2元/小时,还能利用学生福利免费畅玩。快速上手教程与省钱攻略,助你轻松征服《黑神话:悟空》!
1097 8
学生0元购|低配也能畅玩!《黑神话:悟空》云电脑攻略
|
消息中间件 缓存 Kafka
Kafka的producer如何实现幂等性
Kafka的producer如何实现幂等性
1072 1
|
云安全 SQL 安全
数字时代下的Web应用程序安全:漏洞扫描服务的功能与优势
在当今这个数字化时代,Web应用程序不仅是企业与用户之间互动的桥梁,更是企业展示服务、传递价值的核心平台。然而,随着技术的不断进步,Web应用程序的复杂性也在不断增加,这为恶意攻击者提供了可乘之机。安全漏洞的频发,如SQL注入、跨站脚本攻击(XSS)、跨站请求伪造(CSRF)等,严重威胁着企业的数据安全、服务稳定性乃至经济利益。在这样的背景下,漏洞扫描服务作为一道重要的安全防线,显得尤为重要。本文将深入探讨漏洞扫描服务在面对Web应用程序安全问题时,所具备的功能优势。
|
前端开发 Java 应用服务中间件
JavaEE:Servlet后端搭建部署 一条龙全教程
JavaEE:Servlet后端搭建部署 一条龙全教程
451 0