带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(5) https://developer.aliyun.com/article/1243279?groupCode=taobaotech
音频3A综合体验
在推流采集时不可避免会采集到环境或设备噪声,另外扬声器的声音经房间空间反射被麦克风捕捉采集到系统当中,易形成回声,这是一种非常不好的体验。因此在音频编码之前会会经混音消除、降噪、自动增益控制等音频的前处理过程。噪声抑制(AEC,Acoustic Echo Cancelling),将噪声和人声分成2个频道处理,实现噪声抑制,人声增强。回声消除(ANC,Active Noise Control),识别并消除声学、线路回声。增益控制(AGC,Automatic Gain Control),可为输入的音频数据带来明显的质量优化,如提高信噪比,避免输入信号溢出等。音频数据完成回声消除(AEC)与噪声抑制(ANS)的处理后一般会进行AGC。
在PC高清直播质量评测项目中,我们的测试集结合开发的特征算法优化采集了多种场景的视频内容,评价画质优化效果。
在对音频进行评测分析前,需要先了解时域图、频域图、语谱图等概念。时域分析与频域分析是对模拟信号的两个观察面。
1. 时域图:表现的是一段音频在一段时间内音量的变化,其横轴是时间方向,纵轴是振幅方向。
2. 频谱图:表现的是一段音频在某一时刻各个频率的音量的高低,其横轴是频率方向,纵轴为振幅方向。
3. 语谱图:先将语音信号作傅里叶变换,然后以横轴为时间,纵轴为频率,用颜色表示幅值即可绘制出语谱图。在一幅图中表示信号的频率、幅度随时间的变化,故也称“时频图”。
我们在音频评测方面目前支持了音频卡顿率,频宽,延时,3A算法,PESQ和主观评测。下面重点介绍一下3A算法(降噪ANS、自动增益AGC、回声消除AEC控制)的评测方法。
带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(7) https://developer.aliyun.com/article/1243277?groupCode=taobaotech