带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(6)

简介: 带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(6)

带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(5) https://developer.aliyun.com/article/1243279?groupCode=taobaotech



音频3A综合体验


在推流采集时不可避免会采集到环境或设备噪声,另外扬声器的声音经房间空间反射被麦克风捕捉采集到系统当中,易形成回声,这是一种非常不好的体验。因此在音频编码之前会会经混音消除、降噪、自动增益控制等音频的前处理过程。噪声抑制(AEC,Acoustic Echo Cancelling),将噪声和人声分成2个频道处理,实现噪声抑制,人声增强。回声消除(ANC,Active Noise Control),识别并消除声学、线路回声。增益控制(AGC,Automatic Gain Control),可为输入的音频数据带来明显的质量优化,如提高信噪比,避免输入信号溢出等。音频数据完成回声消除(AEC)与噪声抑制(ANS)的处理后一般会进行AGC。


image.png


在PC高清直播质量评测项目中,我们的测试集结合开发的特征算法优化采集了多种场景的视频内容,评价画质优化效果。


在对音频进行评测分析前,需要先了解时域图、频域图、语谱图等概念。时域分析与频域分析是对模拟信号的两个观察面。


1. 时域图:表现的是一段音频在一段时间内音量的变化,其横轴是时间方向,纵轴是振幅方向。


2. 频谱图:表现的是一段音频在某一时刻各个频率的音量的高低,其横轴是频率方向,纵轴为振幅方向。


3. 语谱图:先将语音信号作傅里叶变换,然后以横轴为时间,纵轴为频率,用颜色表示幅值即可绘制出语谱图。在一幅图中表示信号的频率、幅度随时间的变化,故也称“时频图”。


image.png


我们在音频评测方面目前支持了音频卡顿率,频宽,延时,3A算法,PESQ和主观评测。下面重点介绍一下3A算法(降噪ANS、自动增益AGC、回声消除AEC控制)的评测方法。



带你读《2022技术人的百宝黑皮书》——淘宝直播端到端音视频评测方案首次公开(7) https://developer.aliyun.com/article/1243277?groupCode=taobaotech

相关文章
|
机器学习/深度学习 算法 程序员
C++ Algorithm 库 算法秘境探索(Algorithm Wonderland Exploration)
C++ Algorithm 库 算法秘境探索(Algorithm Wonderland Exploration)
745 1
|
Java 安全
一文读懂Java泛型中的通配符 ?
之前不太明白泛型中通配符"?"的含义,直到我在网上发现了Jakob Jenkov的一篇文章,觉得很不错,所以翻译过来,大家也可以点击文末左下角的阅读原文看英文版的原文。 下面是我的译文: Java泛型中的通配符机制的目的是:让一个持有特定类型(比如A类型)的集合能够强制转换为持有A的子类或父类型的集合,这篇文章将解释这个是如何做的。
14923 2
|
人工智能 自然语言处理 算法
通义灵码助力技术求职:如何成为笔试面试冲刺的“超级助手”
在技术岗位竞争日益激烈的当下,求职季的备战已不仅是知识储备的较量,更是效率与实战能力的比拼。面对海量面试题、复杂算法挑战及快速迭代的技术框架,开发者亟需高效工具辅助突破瓶颈。阿里云推出的智能编码工具通义灵码,凭借其代码生成、优化及智能问答等核心能力,正成为开发者备战求职季的“超级助手”。
|
数据采集 JSON 数据可视化
JSON数据解析实战:从嵌套结构到结构化表格
在信息爆炸的时代,从杂乱数据中提取精准知识图谱是数据侦探的挑战。本文以Google Scholar为例,解析嵌套JSON数据,提取文献信息并转换为结构化表格,通过Graphviz制作技术关系图谱,揭示文献间的隐秘联系。代码涵盖代理IP、请求头设置、JSON解析及可视化,提供完整实战案例。
813 4
JSON数据解析实战:从嵌套结构到结构化表格
|
机器学习/深度学习 自然语言处理
语言模型微调
语言模型微调
|
JavaScript
nodejs自动接收新邮件进行处理
通过imap 来接收邮箱新邮件,类似客户端系列,不过比较简单的,目前只有新邮件,后续也可以通过这个来做一个自己的邮件客户端。
nodejs自动接收新邮件进行处理
|
XML Java API
Spring Boot快速入门指南
Spring Boot快速入门指南
|
存储 索引 Python
Python列表的循环遍历详解
Python列表的循环遍历详解
856 1
|
网络协议 中间件 机器人
通过顶顶通呼叫中心中间件玩转FreeSWITCH媒体流
怎么获取FreeSWITCH的媒体流是一个老生常谈的问题了,最常见的方法media_bug 很多人需要直接获取原始的声音流,然后自己处理,其实FreeSWITCH也是支持的,只是知道的极少,FreeSWITCH原生支持 unicast 通过udp 把声音流推送到一个UDP端口,和播放网络的声音流。 fs实现的unicast,有一个缺陷如果启动了unicast 就没办法调用playback等放音函数了。
1410 0
|
Web App开发 安全 Windows
win10_x64更新错误解决: 安装一些更新时出现问题,但我们稍后会重试。如果持续出现这些问题,并且你想要搜索Web或联系支持人员以获取相关信息,以下信息可能会对你有帮助:
可能的原因:  1、windows 服务没打开 win+r,打开【运行】对话框 输入 【service.msc】 找到 【Windows Firewall】和【Internet connection sharing】 都启动,并设为【自动】,重新启动 【设置】--【更新和安全】 2、设置的代理,但是代理没打开 将设置的代理服务器打开。
7825 0