带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(6)

简介: 带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(6)

带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(5) https://developer.aliyun.com/article/1243279?groupCode=taobaotech



音频3A综合体验


在推流采集时不可避免会采集到环境或设备噪声,另外扬声器的声音经房间空间反射被麦克风捕捉采集到系统当中,易形成回声,这是一种非常不好的体验。因此在音频编码之前会会经混音消除、降噪、自动增益控制等音频的前处理过程。噪声抑制(AEC,Acoustic Echo Cancelling),将噪声和人声分成2个频道处理,实现噪声抑制,人声增强。回声消除(ANC,Active Noise Control),识别并消除声学、线路回声。增益控制(AGC,Automatic Gain Control),可为输入的音频数据带来明显的质量优化,如提高信噪比,避免输入信号溢出等。音频数据完成回声消除(AEC)与噪声抑制(ANS)的处理后一般会进行AGC。


image.png


在PC高清直播质量评测项目中,我们的测试集结合开发的特征算法优化采集了多种场景的视频内容,评价画质优化效果。


在对音频进行评测分析前,需要先了解时域图、频域图、语谱图等概念。时域分析与频域分析是对模拟信号的两个观察面。


1. 时域图:表现的是一段音频在一段时间内音量的变化,其横轴是时间方向,纵轴是振幅方向。


2. 频谱图:表现的是一段音频在某一时刻各个频率的音量的高低,其横轴是频率方向,纵轴为振幅方向。


3. 语谱图:先将语音信号作傅里叶变换,然后以横轴为时间,纵轴为频率,用颜色表示幅值即可绘制出语谱图。在一幅图中表示信号的频率、幅度随时间的变化,故也称“时频图”。


image.png


我们在音频评测方面目前支持了音频卡顿率,频宽,延时,3A算法,PESQ和主观评测。下面重点介绍一下3A算法(降噪ANS、自动增益AGC、回声消除AEC控制)的评测方法。



带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(7) https://developer.aliyun.com/article/1243277?groupCode=taobaotech

相关文章
|
5月前
|
搜索推荐 API 对象存储
|
5月前
|
分布式计算 搜索推荐 API
|
算法 测试技术 vr&ar
带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(8)
带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(8)
144 0
|
机器学习/深度学习 算法
带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(4)
带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(4)
119 0
|
算法
带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(5)
带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(5)
105 0
|
算法
带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(7)
带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(7)
106 0
|
编解码 安全 数据挖掘
带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(1)
带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(1)
192 0
|
缓存 编解码 文字识别
带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(2)
带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(2)
156 0
|
机器学习/深度学习 存储 算法
带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(3)
带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(3)
116 0
带你读《2022技术人的百宝黑皮书》——《电商直播高画质开播指南》正式发布, 6步快速搭建一个高清直播间(3)
带你读《2022技术人的百宝黑皮书》——《电商直播高画质开播指南》正式发布, 6步快速搭建一个高清直播间(3)
102 0