从云原生到智能化,深度解读行业首个「视频直播技术最佳实践图谱」

简介: 直播技术在演变

61770134-410B-477E-B9FE-D22C8724325E.png

在2022阿里云直播峰会上,多位直播产业领域技术专家与行业先行者,共同探讨超视频化时代视频直播技术的演进趋势与未来发展。会上,阿里云重磅发布了行业首个「视频直播技术最佳实践图谱」,将直播技术归纳总结为7点:云原生、高可靠、低延时、超高清、智能化、专业性及多场景,本文将对「视频直播技术最佳实践图谱」进行深度解读。


视频直播的趋势就是极致降低延时,其包含传输延时和计算延时。


谈到延时,大众对于延时的理解主要集中在传输延时上,依据视频的延时,可以将视频分成点播、直播、连麦互动、实时互动等。


  • 当传输的延时在3-10秒,这样的视频具备可广播的属性,如:体育赛事直播;
  • 当传输的延时在250-800毫秒之间,可进行沟通、互动,如:互动课堂连麦等;
  • 当传输的延时降低至50-80毫秒,此时视频便具有可操控性和沉浸感,如:云实时3D渲染、远程视频操控……

截屏2022-07-14 下午3.53.58 (2).png

除了传输延时,视频的编解码、高清化等技术的计算也会带来算力的延时。紧随直播的趋势,如何能将传输延时和计算延时不断降低,为更多直播场景带来技术支撑及想象空间?


阿里云的直播技术基于云原生的底座和分布式边缘节点,通过对传输协议的改造,融合实时媒体处理能力与边缘算力,能够大幅有效降低传输延时与计算延时,并通过全球实时流媒体传输网络GRTN(‍Global Real-time Transport Network)、超低延时直播服务RTS(Real-time Streaming)、实时媒体处理能力、视频+AI等技术应用,完成低延时的最佳实践,实现成本与体验的最佳平衡,在带来众多通用直播解决方案的同时,也衍生出众多场景化解决方案。


本次峰会发布的行业首个「视频直播技术最佳实践图谱」,是经过阿里云多年的直播技术探索与实践沉淀而来的,归纳总结为7大点:云原生、高可靠、低延时、超高清、智能化、专业性及多场景。

8EB6025D-C3BB-4f07-874F-2FDD105D52AC.png


云原生

视频技术就是云原生的最佳实践。


阿里云所倡导的云原生主要有三点:“产品的服务化”,“随意的弹性”,“软硬一体、云边一体、云端一体”,而视频技术恰恰就是云原生的最佳实践。


云的基础设施,包括中心节点、边缘节点、CDN网络是保障大规模分发和传输的基础;云原生的软硬一体,能支持CPU/GPU/FPGA/ASIC等多种软硬件异构方案;云与端的紧密协同和算力分配,能实现云、移动端、Web端、PC端渲染效果一致。


除此之外,云原生的时间、空间、异构弹性,不仅能支持数十种业务混跑,云边端计算量化灵活调整,还能实现100+种实时传输、媒体处理、AI任务多机型异构混跑,给视频业务带来无限的算力的同时将资源充分有效利用起来,大幅降低成本,衍生出更多新场景。

截屏2022-07-18 上午11.31.57 (2).png


高可靠

热点视频有千万级的实时并发,高可靠是最基本的要求。


视频直播技术需要高可靠,尤其是热点视频往往会带来百万、千万级的并发,此时高可靠是最基本的要求。阿里云的视频技术高可靠主要体现两方面,一是在架构上拥有全链路日志/监测/报警/预测和高可靠、多副本的秒级切换,能实现智能自动化运维和接入网络秒级信息排查,带来跨中心逃逸能力及容灾服务保障。


高可靠的第二个方面,体现在对弱网体验的提升。阿里云独有的QoS技术,能对带宽进行精准预测,大幅提升带宽利用率和拥塞控制能力,同时结合编码器的弱网感知和抗丢包技术,能在70%的丢包状态下仍达到较高清晰度和流畅性。基于深度学习的智能语音丢包补偿,能提升弱网状态下的音频清晰度,而麦上麦下延迟敏感自适应技术,能在多场景下实现音频流畅性和通话延迟的平衡。QoS技术能识别和动态适配如:丢包、延时等多种网络场景,大大提升终端用户对业务性能的音视频主观感受。

截屏2022-07-19 下午3.51.59 (2).png


低延时

GRTN打造最佳流媒体实践场景。


延时指的是主播端的画面传递到用户屏幕所耗费的时间,当排除网络、码流、设备性能的情况下,在不同的直播场景中选用合适的直播流协议,能大大降低直播的延时。回顾直播的历史,也是直播协议的历史,主流的协议有耳熟能详的HLS、DASH、RTMP等,延时普遍在5s以上,在强互动的需求下,直播协议也在不断向低延时转化,比如:SRT、LL-HLS等。

截屏2022-07-18 上午11.32.25 (2).png

阿里云在低延时上的最佳实践,主要在两个方面。一是在网络层面,将传统的CDN内容分发网络改造成GRTN全球实时传输网,其定位是基于中心云和边缘云的异构节点,构建超低延时、全分布式下沉的通信级流媒体传输网络。


GRTN目前融合了互联网直播和RTC等多种业务场景的音视频流传输和交换,并具有众多其他核心技术,如:GRTN构建的双向的实时信令网能够做到切网消息的毫秒级传递,当有一个发布端的媒体流发生网络切换后,订阅的客户端对GRTN内部发生的切换行为是完全无感知的。

截屏2022-07-18 上午11.32.34 (2).png

二是在这“一张网”上,阿里云打造了超低延时直播服务RTS(Real-Time Streaming)。基于GRTN的短延时直播RTS可以支持标准H5 WebRTC推播,在千万级并发情况下延时可以控制在1s以内;RTC端到端延时可以控制在250ms左右。观看下方RTS和RTMP的直播协议的对比视频,可以发现在有一定丢包率的情况下,RTS在体验、流畅度和色彩上都相对RTMP有明显的优势。


RTS与RTMP延迟对比视频


超高清

成本与体验的最佳调和,带来更沉浸、更极致的音视频体验。


关于超高清在视频直播技术中的实践,阿里云自研的s265编码技术能实现高画质低码率,并支持4K实时编码;支持AV1编码,较HEVC节省25%以上的码率。大众熟知的“窄带高清”技术,窄高1.0对多场景进行优化,通过RIO和JND智能编码节约码率,窄高2.0自适应视频降噪和内容修复,通过色彩和纹理增强提升人眼主观画质,带来体验和成本的最佳调和。

截屏2022-07-18 上午11.34.33 (2).png

与此同时,阿里云在直播技术上还对采集编码传输链路进行优化,全链路支持4K和8K。在工程上,通过各类算法对帧率、码率、分辨率、色彩等各维度进行提升,无论是老片、瑕疵、人像、还是动画场景,都能进行修复带来超高清的体验。


除了在云端对视频进行处理,还能在端侧进行超分插帧、降噪、色彩增强等,即使是非HDR的设备,通过色彩增强SDR+技术,也能实现端侧一致的超高清体验。

20220720103433.jpg

端侧超高清对比

截屏2022-07-20 上午10.38.37 (2).png

色彩增强SDR+技术


智能化

在超视频化时代,音视频的智能化是一大趋势。


深度学习能带来各类AI能力的提升,在视频实践上是最好的一个出口。在智能化方面,阿里云的视频直播技术,除了传统的智能配音、智能拆条、智能集锦,还能对音视频内容实时审核,针对黄反暴恐广告实现精准识别,节省了大量的人工甄别成本。

截屏2022-07-19 下午3.54.32 (2).png

经过训练的虚拟人技术,支持3D头像、Live2D、风格化迁移、虚拟主播等,带来更多XR技术的演进。此外,“智能化”还体现在音频体验上,基于深度学习技术与传统信号处理有机结合的3A技术,能实现智能降噪、突出人声、无损音乐,并可以广泛应用于各类实时场景。智能语音超分技术,在小模型的情况下仍可保持高音质,这些都是AI与视频结合带来的效果。

“智能降噪”的多场景体验


专业性

专业性,让直播逐渐演变成“智播”。


阿里云对于直播技术的专业性体现在多码率、多协议、内容保护和实时制作上,直播逐渐演变为“智播”。值得一提的是,在实时制作方面,阿里云将传统导播台云端再造,融合实时翻译、图文包装、动态标签、广告替换等导播创新能力,兼顾直播专业性与远程导播优势。

截屏2022-07-18 上午11.37.04 (2).png

同时,基于多路实时实景抠像,阿里云还曾将“虚拟演播室”搬到冬奥现场。阿里云的“云导播”技术,不仅支持多种设备、多机位、异地开播,还能够实现双屏、分屏、画中画等开播场景,最大程度贴近直播需求。

互动虚拟演播室助力冬奥


阿里云在直播技术上的专业性结合“云导播”丰富的节目制作形式、更低的成本,能够广泛应用到广电新媒体、赛事直播、活动直播、商业直播等场景中,帮助客户打破业务瓶颈,更快更好地开展业务。


《这!就是街舞》云导播+帧级别多视角同步


多场景

“直播+”已成为一种趋势,渗透到各个场景。


从场景来看,直播从最早的大型文体直播、电商直播、游戏直播逐渐渗透到企业培训、在线教育、广电新媒体场景。阿里云将直播、点播、在线会议的各种算法能力都集成到同一个SDK里面,实现多场景融合的同时,一体化SDK还能按需打包实现灵活的自定义。


从传统的SDK接入、API接入到“低代码直播样板间”,阿里云直播针对电商直播、在线教育、企业直播等提供一站式接入的场景方案,通过简单的三步对接和十几行代码,让客户轻松接入直播的体验,助力业务的发展。

截屏2022-07-18 下午2.32.22 (2).png

当前,直播业务已成为数字化社会服务的重要组成部分,越来越多的内容与产业转向“直播+”模式,直播技术发展的未来图景随着市场需求变化更加清晰。


「视频直播技术最佳实践图谱」正是基于阿里云在直播技术上多年的探索和最佳实践,从直播技术的核心,到直播的全场景覆盖,再到直播技术创新与应用,助力企业深度理解“直播”,打破技术壁垒,携手各行各业在万物互联的浪潮中不断更迭与前行。


「视频云技术」你最值得关注的音视频技术公众号,每周推送来自阿里云一线的实践技术文章,在这里与音视频领域一流工程师交流切磋。公众号后台回复【技术】可加入阿里云视频云产品技术交流群,和业内大咖一起探讨音视频技术,获取更多行业最新信息。    

相关文章
|
4月前
|
监控 Cloud Native Java
Quarkus 云原生Java框架技术详解与实践指南
本文档全面介绍 Quarkus 框架的核心概念、架构特性和实践应用。作为新一代的云原生 Java 框架,Quarkus 旨在为 OpenJDK HotSpot 和 GraalVM 量身定制,显著提升 Java 在容器化环境中的运行效率。本文将深入探讨其响应式编程模型、原生编译能力、扩展机制以及与微服务架构的深度集成,帮助开发者构建高效、轻量的云原生应用。
478 44
|
3月前
|
Kubernetes Cloud Native 云计算
云计算与云原生技术探索
🌟蒋星熠Jaxonic,云原生探索者!以代码为舟,遨游技术星河。专注容器化、微服务、K8s与DevOps,践行GitOps理念,拥抱多云未来。用架构编织星辰,让创新照亮极客征途!
云计算与云原生技术探索
|
8月前
|
人工智能 Cloud Native 安全
云原生+AI 为企业出海提供全新技术引擎!明天见
5月22日 14:00「飞天发布时刻」,阿里云云原生应用平台产品负责人李国强将重磅揭晓面向 AI 场景的云原生产品体系升级,通过弹性智能的全球一体化架构、开箱即用的云原生 AI 工程化能力,为中国企业出海提供全新技术引擎。
|
3月前
|
Java Linux 虚拟化
【Docker】(1)Docker的概述与架构,手把手带你安装Docker,云原生路上不可缺少的一门技术!
1. Docker简介 1.1 Docker是什么 为什么docker会出现? 假定您在开发一款平台项目,您的开发环境具有特定的配置。其他开发人员身处的环境配置也各有不同。 您正在开发的应用依赖于您当前的配置且还要依赖于某些配置文件。 您的企业还拥有标准化的测试和生产环境,且具有自身的配置和一系列支持文件。 **要求:**希望尽可能多在本地模拟这些环境而不产生重新创建服务器环境的开销 问题: 要如何确保应用能够在这些环境中运行和通过质量检测? 在部署过程中不出现令人头疼的版本、配置问题 无需重新编写代码和进行故障修复
395 2
|
9月前
|
Cloud Native 关系型数据库 分布式数据库
|
9月前
|
存储 关系型数据库 分布式数据库
|
8月前
|
存储 缓存 分布式计算
StarRocks x Iceberg:云原生湖仓分析技术揭秘与最佳实践
本文将深入探讨基于 StarRocks 和 Iceberg 构建的云原生湖仓分析技术,详细解析两者结合如何实现高效的查询性能优化。内容涵盖 StarRocks Lakehouse 架构、与 Iceberg 的性能协同、最佳实践应用以及未来的发展规划,为您提供全面的技术解读。 作者:杨关锁,北京镜舟科技研发工程师
StarRocks x Iceberg:云原生湖仓分析技术揭秘与最佳实践
|
6月前
|
缓存 Cloud Native Java
Java 面试微服务架构与云原生技术实操内容及核心考点梳理 Java 面试
本内容涵盖Java面试核心技术实操,包括微服务架构(Spring Cloud Alibaba)、响应式编程(WebFlux)、容器化(Docker+K8s)、函数式编程、多级缓存、分库分表、链路追踪(Skywalking)等大厂高频考点,助你系统提升面试能力。
317 0
|
9月前
|
存储 关系型数据库 分布式数据库
登顶TPC-C|云原生数据库PolarDB技术揭秘:高可用-无感切换篇
阿里云PolarDB云原生数据库在TPC-C基准测试中以20.55亿tpmC的成绩刷新世界纪录,单位成本仅0.8元人民币。PolarDB通过VotingDisk实现秒级故障切换,RPO=0,提供高可用性。PolarDB还推出国产轻量版,兼具高性能与低成本,满足多样化需求。