《云上社交行业技术服务白皮书》——第四章 云上社交保障与服务案例——4.1 社交平台可靠性——4.1.2 质量指标衡量标准(上) https://developer.aliyun.com/article/1232326?groupCode=supportservice
4.1.2.2.3 点播评分方式
各项指标加权平均:
总分 = 错误率/3+中断率/3+卡顿率/3
4.1.2.2.4 点播质量日报指标说明
各项指标算法及说明:
•单位时间:每5分钟为一个单位。
•首帧时间:从用户开始播放到出现首帧画面的时长,单位时间:毫秒。
•卡顿:在播放过程中出现的网络卡顿次数,一次播放中,不论卡顿多少次,都计 数为1次。
•未起播:用户请求多次播放地址均未加载成功,计数为1次。
•播放中断:用户在播放过程中,因网络等原因未成功继续播放,计数为1次。
•错误数:指响应5XX状态码、连接超时的请求。
•播放失败:用户请求多次主备播放地址均未播放成功,计数为1次。
•百秒卡顿时长:用户每播放100秒视频所经历的卡顿时长,单位时间:毫秒。
4.1.2.3 质量告警方式和内容
4.1.2.3.1 告警平台
除了质量的评价标准和日报,还需要及时发现问题、定位问题的能力,而这就需 要精确有效而多样的告警方式。而一般都会选用邮件+IM工具,而有些大的客户也会 选用自建平台进行质量的实时监控。
直播指标:
某头部短视频客户:审核实时流成功率、拉流成功率、时移失败率、错误率、 百秒卡顿时长、 直播首推成功率
•某头部短视频客户:卡顿率、开播失败率
点播指标:
•某头部短视频客户:卡顿率、下载耗时、中断率、未播放离开、失败率、成功率
•某头部短视频客户:下载失败率、下载失败率,慢速下载率、quic_fallback_ 占 比、quic_ 占比
4.1.2.3.2 告警内容
直播告警内容(平台IM+邮件)
•上行告警方式:主播名称 线路 卡顿率占比 卡原因 流名称
举例:时间主播告警主播[xxx],线路[3]当前感官卡顿率为:60%卡原因:转码环节, 流名称:http://xxx
•下行告警方式:业务类型域名时间地区运营商卡顿率占比开播失败率占比观看人 数开播失败率状态持续时间
举例:NOTI直播质量监控直播域名03-19 11:30
新疆- 电信:当前卡顿率24.13%,开播失败率3.78%,观看行为数1090;卡顿率 超过阈值。
点播告警内容(IM+邮件)
•下行告警方式:业务类型域名时间地区运营商终端类型下载量下载失败率占比 下载失败 率日同比变化 持续时间
举例:WARN 短视频下载监控点播域名03-19 06:20
宁夏-VIDEO-移动-WIFI:当前下载失败率9.60%,下载量9624.0;下载失败 率日同比变化125.1%。