《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.2 直播业务稳定性保障——5.2.2 直播业务监控最佳实践(1)

简介: 《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.2 直播业务稳定性保障——5.2.2 直播业务监控最佳实践(1)

5.2.2 直播业务监控最佳实践


基于媒体类直播点播场景,通过对于当前主流客户质量监控体系模型进行提炼,输出了客户端日志上报字段推荐、质量监控通用指标及报警方式建议。可帮助相关业务同学更清晰了解媒体类客户质量核心诉求,并为多媒体客户提供质量监控系统参考。涵盖了各大行业标杆客户质量评估体系,指标,算法,阈值,权重等。


1.质量评价体系


在1996年,ITU国际组织就已经有了主观评价流媒体音视频的传输质量,当时主要评测电话的通话质量。在2003年根据主观评价提出了一套MOS体系,MOS,ITU-T Rec BT.500 给出的操作范例保证了主观实验的信度和效度。将主观的视频感受投射到[1,5]的区间内,MOS质量评价的主要目的,是根据用户的主观体验来对音频或者是视频质量进行评分。它的分值,常规意义上是分为五分,分值越高它的质量就越好。


•MOS质量评价

image.png


视频质量的评分

视频质量:视频分辨率与屏幕尺寸的关系4分以上可以算是比较好的观看体验,视频服务时,如果用户对于视频的要求不是特别苛刻,通常情况来讲720P足够了;个别提供1080P,其实对观看体验并没有特别大的提升,仅从4.3分提升到4.6分,这个过程不光对码率有要求,视频帧率、解码难度都会高出很多。一般电视端想要达到4.0分以上的观看体验的话,需要1080P的视频。高分辨率对应的解码代码也要求高,如果客户端达不到视频的解码带宽要求就会卡顿是直播经常遇到的现象。表现为 用户体感界面不流畅。正常情况下人眼能否清晰的分辨出画面是否连贯是以25帧作为分界线,高于25帧到达60fps时,基本肉眼已经很难分别画面的清晰度上的差异,生活中的手机、电脑屏幕画面是按照一定频率来刷新的,但是实际上,这个只是针对普通的视频而言。对于一些强交互或者较为敏感的场景来说,比如游戏,起码需要 60帧,30帧的游戏会让人感觉不适,大幅度动画30帧会有明显顿挫感;跟手动画如果能到90帧甚至120帧,会让人感觉十分细腻。


视频体验,首屏秒开的标准

首屏秒开指的的是客户端拉流时播放器加载到第一帧画面被客户看到所记录的时间。首屏秒开通常被认为在100毫秒以内才算完美。公网环境下首屏秒开达到100毫秒的几乎没有,常规意义上,我们都会努力让首屏秒开做到1秒也就是1000毫秒左右的时间。现有像快手、斗鱼、虎牙这一类的App,通常首屏时间都会做到3秒以内。3秒是一个界限,大家一般是2秒左右。


观看体验

观看体验包括两部分:花屏和卡顿。现在直播平台在又拍云等CDN服务商的努力下,“花屏”已经出现得很少了,主要影响观看体验得因素是“卡顿“,主要指的是在一分钟内卡顿出现了多少次,每一次卡顿的时长有多少,最后得出来一个卡顿的时长占比。观看体验的质量评价体系是实验室环境下得出的。观看体验的典型分值 (卡顿统计周期1分钟)


2.关键指标参考


外部直播检测关键指标:

直播点播可以通过一些第三方的监测评估工具进行质量监控。以公共监测工具基调-流媒体监测关键指标为例:


•缓冲前准备时间:从开始监测到第一次缓冲出现的时间,包含了DNS解析时间、发出数据请求及接收第一 个数据包的时间。

•缓冲时间:流媒体播放器处于首次缓冲状态待续的总时间。

•等待时间:等于连接时间+首次缓冲时间+所有再缓冲时间;是一个重要的指

标,系统用此值来表示流媒体文件监测的性能。缓冲次数越多,用户体验指数表现越差。

•用户体验指数:反映用户实际播放体验的综合指标,等于等待时间(秒)+(缓冲

次数-1),等待时间越长,缓冲次数越多,用户体验指数表现越差。


•多媒体行业头部客户关键指标

开播失败率、首帧时间、卡顿率、错误率、卡顿次数等。


《云上业务稳定性保障实践白皮书》——五.行业客户稳定性保障实践——5.2 直播业务稳定性保障——5.2.2 直播业务监控最佳实践(2) https://developer.aliyun.com/article/1231954?groupCode=supportservice

相关文章
|
10月前
|
存储 Oracle Java
大厂(转转、携程、京东)都用分代ZGC,卡顿降低20倍,吞吐量提升4倍。分代ZGC 这么牛?底层原理是什么?
大厂(转转、携程、京东)都用分代ZGC,卡顿降低20倍,吞吐量提升4倍。分代ZGC 这么牛?底层原理是什么?
|
11月前
|
Java Maven Android开发
微服务——SpringBoot使用归纳——Spring Boot开发环境搭建和项目启动
本文介绍了Spring Boot开发环境的搭建和项目启动流程。主要内容包括:jdk的配置(IDEA、STS/eclipse设置方法)、Spring Boot工程的构建方式(IDEA快速构建、官方构建工具start.spring.io使用)、maven配置(本地maven路径与阿里云镜像设置)以及编码配置(IDEA和eclipse中的编码设置)。通过这些步骤,帮助开发者顺利完成Spring Boot项目的初始化和运行准备。
985 0
微服务——SpringBoot使用归纳——Spring Boot开发环境搭建和项目启动
|
9月前
|
运维 Linux 网络安全
国产服务器管理工具对比
本内容以表格形式对比了五款工具(宝塔面板、1Panel、gmSSH、Xterminal)的功能定位、用户界面、核心功能、适用场景等关键维度。涵盖服务器运维、容器化管理、SSH客户端及跨平台支持等方面,帮助用户根据需求选择合适的工具。适合开发者、运维人员及中小企业技术团队参考。
|
存储 安全 API
12种最基本Web API:开发者的必学清单⭐
这些Web API 为创建高度互动和用户友好的网页应用开辟了无限可能。从存储和支付到地理位置和图形,掌握这些 API 可以提升您的Web开发技能。
731 2
|
8月前
|
存储 人工智能 网络协议
为什么NAS需要内网穿透,如何给自建NAS做内网穿透
内网穿透是一种解决外网访问内网服务的技术,通过公网服务器中转或直连方式,实现对家中的NAS、摄像头等设备的远程访问。文章详细介绍了内网与外网的区别、NAS为何需要内网穿透,以及两种主要实现方式:端口转发和P2P直连。同时列举了常见工具如NAT123、FRP、Ngrok和Infortress,分别适合不同技术基础的用户。总结指出,内网穿透让远程访问变得便捷,而相关工具则降低了使用门槛,让更多人受益于这项技术。
|
机器学习/深度学习 TensorFlow 算法框架/工具
使用Python实现深度学习模型:智能质量检测与控制
使用Python实现深度学习模型:智能质量检测与控制 【10月更文挑战第8天】
927 62
使用Python实现深度学习模型:智能质量检测与控制
|
存储 弹性计算 监控
从外到内:阿里云弹性与资源交付效率的全景透视
本文介绍了弹性服务的概念及其在云计算中的重要性。弹性服务通过动态调整云资源,帮助用户应对流量波动,降低成本并提高自动化水平。文中详细探讨了如何从“使用弹性”迈向“善用弹性”,包括定时任务、报警任务和目标追踪等伸缩模式的应用。同时,文章还介绍了阿里云在ECS弹性能力方面的建设成果,如每分钟交付万台实例的能力,并分享了汇量科技和Auto MQ两个客户案例的成功实践。最后,展望了未来在弹性计算领域的技术创新和发展方向,强调了持续优化和提升弹性能力的重要性。
|
搜索推荐 测试技术 API
探秘电商API:从测试到应用的深度解析与实战指南
电商API是电子商务背后的隐形引擎,支撑着从商品搜索、购物车更新到支付处理等各个环节的顺畅运行。它通过定义良好的接口,实现不同系统间的数据交互与功能集成,确保订单、库存和物流等信息的实时同步。RESTful、GraphQL和WebSocket等类型的API各自适用于不同的应用场景,满足多样化的需求。在测试方面,使用Postman、SoapUI和jMeter等工具进行全面的功能、性能和安全测试,确保API的稳定性和可靠性。未来,随着人工智能、大数据和物联网技术的发展,电商API将进一步智能化和标准化,为用户提供更个性化的购物体验,并推动电商行业的持续创新与进步。
557 5
|
缓存 关系型数据库 MySQL
一文彻底弄懂MySQL优化之深度分页
【10月更文挑战第24天】本文深入探讨了 MySQL 深度分页的原理、常见问题及优化策略。首先解释了深度分页的概念及其带来的性能和资源问题。接着介绍了基于偏移量(OFFSET)和限制(LIMIT)以及基于游标的分页方法,并分析了它们的优缺点。最后,提出了多种优化策略,包括合理创建索引、优化查询语句和使用数据缓存,帮助提升分页查询的性能和系统稳定性。
1787 1
|
人工智能 供应链 安全
AI辅助安全测试案例某电商-供应链平台平台安全漏洞
【11月更文挑战第13天】该案例介绍了一家电商供应链平台如何利用AI技术进行全面的安全测试,包括网络、应用和数据安全层面,发现了多个潜在漏洞,并采取了有效的修复措施,提升了平台的整体安全性。
740 4