带你读《多媒体行业质量成本优化及容灾方案白皮书》1. 直播容灾(2)

简介: 带你读《多媒体行业质量成本优化及容灾方案白皮书》1. 直播容灾(2)

带你读《多媒体行业质量成本优化及容灾方案白皮书》1. 直播容灾(1)https://developer.aliyun.com/article/1351875?groupCode=supportservice


2 直播容灾案例及通用容灾方案

直播业务链路包括了:上行推流、直播中心转码录制、下行分发,故直播业务容灾方案需要评估全链路进行。下面展开多媒体行业头部客户容灾案例及通用容灾方案介绍。

a容灾案例

客户A-大活动场景容灾链路及剖析

 

主流推流到客户自建接流源站-->客户自建源站实现转码、截图、录制等逻辑-->各云厂商拉流客户源站源流及转码流-->客户业务调度服务器按一定的分量逻辑,给终端下发某云厂商A的源流及转码流的主流地址,便于终端播放。

 

备流推流到Y1云厂商边缘-->Y1云厂商实现转码、截图、录制等逻辑,同时将源流分发给其他云厂商,也实现转码、截图、录制等逻辑-->客户业务调度服务器按一定的分量逻辑,给终端下发某云厂商B的源流及转码流的备播流地址,便于终端播放。

 

 

容灾链路剖析

 

上述链路推流链路、直播中心逻辑、下行分发等全链路的容灾。推流链路层面客户自建源站及Y1云厂商实现了主动容灾,直播转码截图录制等逻辑亦是如此,下行播流实现了多云厂商下行分发。

 

同时客户终端还实现了HTTPDNS解析+fallback逻辑,A云厂商的直播流播流失败或长时间低帧率,会重试到B云厂商流,当A云厂商的直播服务/直播分发节点出现异常,或者该终端到A云厂商的分发节点之间链路异常,能自动快速重试到B云厂商逻辑,实现异常问题快速逃逸。

 

对于单云厂商直播节点异常场景,在LDNS解析的情况下,因DNS解析缓存,一般终端业务影响时间会在10-20分钟左右,而实现终端fallback+HTTPDNS解析逻辑,这块的影响会降低到1分钟内,这块的影响时长还是得看终端设置的超时或低帧时长阈值。

某政企客户B容灾链路及剖析

 

主备流推流到客户多个自建接流源站-->某云厂商多直播中心通过主备专线回源拉流主备源流,实现主备源流合流,并对合流流实现转码录制截图等逻辑-->客户业务调度逻辑下发多中心播流域名的源流合流及转码流流地址,终端播放器进行播放;


参考架构如下:

 

image.png

容灾链路剖析

 

上述链路推流链路、直播中心逻辑、下行分发等全链路的容灾,其中推流链路通过单云厂商的的不同接流节点实现容灾,直播中心逻辑通过单云厂商多直播中心实现容灾,下行分发通过单云厂商多节点快切实现容灾。

 

客户终端实现了HTTPDNS解析+fallback逻辑,A域名的直播流播流失败或长时间低帧率,会重试到B域名,当A域名的直播服务/直播分发节点出现异常,或者该终端到A域名的分发节点之间链路异常,能自动快速重试到B域名的其他节点,实现异常问题快速逃逸;

 

对于单云厂商直播节点异常场景,在LDNS解析的情况下,因DNS解析缓存,一般终端业务影响时间会在10-20分钟左右,而实现终端fallback+HTTPDNS解析逻辑,这块的影响会降低到1分钟内,这块的影响时长还是得看终端设置的超时或低帧时长阈值。

 

b) 通用容灾方案

上述的AB案例,介绍了多云厂商、单云厂商情况下的全链路容灾方案,客户可以按需选择上述方案。

相关文章
|
存储 人工智能 OLAP
LangChain+通义千问+AnalyticDB向量引擎保姆级教程
本文以构建AIGC落地应用ChatBot和构建AI Agent为例,从代码级别详细分享AI框架LangChain、阿里云通义大模型和AnalyticDB向量引擎的开发经验和最佳实践,给大家快速落地AIGC应用提供参考。
131893 94
|
关系型数据库 MySQL Linux
Python安装mysqlclient报错避坑
MySQL是常用的开源数据库,Python环境下django框架连接MySQL数据库用的是mysqlclient库,今天在用pip安装mysqlclient库时报错,特记录一下,避免后续继续踩坑。
1560 1
|
存储 消息中间件 缓存
Redis 简介
10月更文挑战第14天
324 58
|
12月前
|
机器学习/深度学习 人工智能 监控
AI视频监控技术的核心优势与实践
AI视频监控技术结合了计算机视觉、深度学习和大数据分析,能够实时分析监控画面,识别异常行为和场景变化。其核心在于从“被动记录”转型为“主动识别”,提升监控效率并减少安全隐患。主要应用场景包括泳池管理、健身器械区域、人员密度预警和异常事件检测。系统架构支持多种摄像头设备,采用边缘计算和Docker部署,具备实时性、高准确率和扩展性等优势。未来将优化复杂场景适应性和实时计算负载,进一步提高系统性能。
2716 7
|
机器学习/深度学习 Python
【Python-Numpy】numpy.random.binomial()的解析与使用
本文介绍了NumPy的`numpy.random.binomial()`函数,用于从二项分布中抽取样本,适用于模拟具有固定试验次数和成功概率的随机实验,并提供了如何使用该函数进行概率计算和模拟实验的示例。
329 4
|
存储 安全 数据安全/隐私保护
移动APP安全加固技术深度解析
【7月更文挑战第12天】移动APP安全加固技术是保障移动应用安全的重要手段。通过对Android和iOS两大主流平台的安全加固,可以有效防止逆向分析、动态调试、数据篡改等安全威胁。在实际应用中,我们需要结合静态层面、动态层面和数据层面的加固技术,全方位地提升APP的安全性。同时,随着技术的不断发展,我们也需要不断关注新的安全威胁和加固技术,确保移动应用的安全性和稳定性。
|
SQL 存储 分布式计算
流批一体技术简介
本文由阿里云 Flink 团队苏轩楠老师撰写,旨在向 Flink 用户整体介绍 Flink 流批一体的技术和挑战。
51230 3
流批一体技术简介
|
SQL Java 应用服务中间件
【Spring】AOP实现公共字段填充
【Spring】AOP实现公共字段填充
304 0
|
Linux Shell C语言
linux下configure,make(makefile),cmake命令详解-makefile和CMakeList
linux下configure,make(makefile),cmake命令详解-makefile和CMakeList
|
并行计算 API C++
GPU 硬件与 CUDA 程序开发工具
GPU 硬件与 CUDA 程序开发工具
394 0