《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.2 直播业务稳定性保障——5.2.2 直播业务监控最佳实践(2) https://developer.aliyun.com/article/1231954?groupCode=supportservice
4.直播监控系统实战
•端上日志采集
1)在手机端埋点,收集由直播SDK回调的音视频帧率、码率、时间戳、以及直播质量相关的数据,上报给服务端。
2)可以节点prom建立一个接收网关,数据推给网关后,prom的agent去拉数据回来进行分析告警。
3)服务单的存储可以采用Elasticsearch等存储服务,将接收的QoS数据转存到
这些存储系统;
4)搭建实时/离线数据流分析服务;
5)数据可视化展示、告警系统。
6)实现以上功能,需要端上SDK研发以及大数据团队经过长周期的测试与数据验证后才能完成监控平台建设。或者借助第三方的云平台去实现绝大部分质量监控功能,如阿里云直播SDK所集成的日志模块,结合服务端的SLS+SPARK+DATAV的形式进行计算存储和展示。客户端只需要控制记录的日志进行二次开发即可。
•基于服务端云监控实现推流上行监控
云监控是一项针对阿里云资源和互联网应用进行监控的服务,云监控自动获取您当前阿里云账号下各云产品的资源,您可以查看目标云产品中指定资源的运行状态和各个指标的使用情况,并对监控项设置报警规则。当符合报警规则时,云监控自动发送报警通知。
•操作方法:
1)登录视频直播控制台。询推流超限报警信息。单击域名管理选择要设置的主播流域名,单击域名配置>基本配置>推流信息中查询可推流上限。记录推流上行并发数限制数值。
2)登录云监控控制台。创建报警规则。单击云产品监控>视频直播>创建报警规则打开创建报警规则窗口。
3)配置创建报警规则。在创建报警规则窗口,在产品列表中选择视频直播,资源范围列表中选择域名,域名列表中选择需要配置的域名,规则描述列表中选择推流上行并发数并设置报警的周期时间。
《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.2 直播业务稳定性保障——5.2.2 直播业务监控最佳实践(4) https://developer.aliyun.com/article/1231952?groupCode=supportservice