带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(6)-阿里云开发者社区

带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(6)

2023-06-07 94

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(6)

带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(5) https://developer.aliyun.com/article/1243279?groupCode=taobaotech

音频3A综合体验

在推流采集时不可避免会采集到环境或设备噪声，另外扬声器的声音经房间空间反射被麦克风捕捉采集到系统当中，易形成回声，这是一种非常不好的体验。因此在音频编码之前会会经混音消除、降噪、自动增益控制等音频的前处理过程。噪声抑制（AEC，Acoustic Echo Cancelling），将噪声和人声分成2个频道处理，实现噪声抑制，人声增强。回声消除（ANC，Active Noise Control），识别并消除声学、线路回声。增益控制（AGC，Automatic Gain Control），可为输入的音频数据带来明显的质量优化，如提高信噪比，避免输入信号溢出等。音频数据完成回声消除（AEC）与噪声抑制（ANS）的处理后一般会进行AGC。

在PC高清直播质量评测项目中，我们的测试集结合开发的特征算法优化采集了多种场景的视频内容，评价画质优化效果。

在对音频进行评测分析前，需要先了解时域图、频域图、语谱图等概念。时域分析与频域分析是对模拟信号的两个观察面。

1. 时域图：表现的是一段音频在一段时间内音量的变化，其横轴是时间方向，纵轴是振幅方向。

2. 频谱图：表现的是一段音频在某一时刻各个频率的音量的高低，其横轴是频率方向，纵轴为振幅方向。

3. 语谱图：先将语音信号作傅里叶变换，然后以横轴为时间，纵轴为频率，用颜色表示幅值即可绘制出语谱图。在一幅图中表示信号的频率、幅度随时间的变化，故也称“时频图”。

我们在音频评测方面目前支持了音频卡顿率，频宽，延时，3A算法，PESQ和主观评测。下面重点介绍一下3A算法（降噪ANS、自动增益AGC、回声消除AEC控制）的评测方法。

带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(7) https://developer.aliyun.com/article/1243277?groupCode=taobaotech

文章标签：

算法

带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(6)

大淘宝技术

热门文章

最新文章

相关课程

相关电子书

相关实验场景

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(6)

大淘宝技术

热门文章

最新文章

相关课程

相关电子书

相关实验场景