Voip中的音频Codec技术-阿里云开发者社区

Voip中的音频Codec技术

2023-05-31 202 发布于吉林

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Voip中的音频Codec技术

持续创作，加速成长！这是我参与「掘金日新计划 · 6 月更文挑战」的第34天，点击查看活动详情

TU G.729(CS-ACELP共扼结构-代数码激励线性预测)语音算法 ITU规定的G.729标准语音处理算法（标准见附），编码速率是8kbps，采样率8KHz，编码延时一帧10ms。其编码语音质量与传统电话接近，是VoIP系统中常用的基础算法。附录A和附录B称作G.729A和G.729B。

G.729现在经进一步的研究和实践将其工作范围扩展至 6.4～11.8kb/s，话音质量也在此范围内有一定的变化，但即使是6.4kb/s，话音质量也还不错，因而很适合在VoIP系统中使用。

ITU G.723.1(ACELP代数码激励线性预测)语音算法 ITU规定的G.723.1标准语音处理算法（标准见附），编码速率有是5.3和6.3kbps两种，采样率8KHz，编码延时一帧30ms。其编码语音质量与G.729接近，是VoIP和数字录音系统中常用的基础算法。附录A称作G.723.1A。

AMR(Adaptive Multi Rate)自适应多速率语音算法 AMR 是ETSI和3GPP等组织规定的GSM,3G,W-CDMA等无线通信系统必须支持的一种标准语音处理算法（标准见附），它的编码速率范围是从4.75 -12.2kbps，采样率8KHz，编码延时一帧20ms。可以根据网络条件在不同的速率之间切换。手机彩铃，彩信，录音，3GP格式等一般都是使用这种算法，与MP3格式可以互相转换。

AMR Wideband(Adaptive Multi Rate)宽带自适应多速率语音算法 AMR Wideband是3GPP规定的宽带AMR算法（标准见附），在ITU标准中规定为G.722.2，其采样率为16KHz，编码速率范围为6.6-23.85kbps，编码延时一帧20ms，主要应用在3G通信系统。

G.722 (SB-ADPCM)

ITU G.722 于 1988 年标准化，是第一个用于 16 KHZ 采样率的标准化宽带语音编码算法。该编解码器将 16 KHZ 的频带分为两个子频带，并用 ADPCM 算法在子频带中进行编码。其总延迟约 3 ms，这已经很小，不致造成电信网络中的回声问题。此外，该编解码器传输位误差率仅为 10-3，其性能可以接受。即使遇到最差的网络传输条件，上述要求也可确保性能只是稍稍下降。

G.722 编解码器在 16 kHz 频率上接收 16 位数据（带宽从 50 Hz 至 7 kHz），并将其压缩为 64、56 与 48 Kbit/s。

G.722.1（转换 (Transform) 编码器）

ITU G.722.1 于 20 世纪 90 年代末开发，可实现比 G.722 编解码器更低的比特率以及更大的压缩。目标是以大约一半的比特率实现与 G.722 大致相当的质量。该编解码器由 Picturetel 开发，使用了转换编码的方法。其在 16 KHZ 频率上接收 16 位数据（带宽从 50 Hz 至 7 kHz），并将其压缩为 32 与 24 Kbits/s。目前大多用于电视会议系统。

G.722.2 (AMR-WB)

AMR-WB 是一种最初为 GSM 无线网络定义的宽带编解码器，但最近扩展为包括有线系统。由于其计算强度很大，因此要充分利用多年来显著提高的 DSP 处理能力。AMR-WB 建立在 CELP 语音编码器基础上，音频带宽为 50－7000 HZ，在 6.6 至 23.85 Kbit/s 间提供 9 种语音编码。

AMR-WB 于 2001 年标准化，用于 GSM 与 WCDMA 网络。2002 年底，ITU 决定它还将作为有线应用的宽带标准。它是第一个具有双重应用范围的编解码器。

表1 几种话音编解码方法的性能对比

　　　　　　编码方法　G.723.1　　　 G.729　　　 G.729A

　　　　　　比特率　　　 5.3/6.3kb/s　　 8kb/s 　　　8kb/s

　　　　　　帧长度　　　30ms 　　　　　10ms 　　　　10ms

　　　　　　处理时延　　 30ms 　　　　　10ms 　　　　10ms

　　　　　　观看时延　　7.5ms 　　　　　5ms 　　　　5ms

　　　　　　帧字节数　　20/24 　　　　　10 　　　　　10

　　　　　　DSP MIP 　　16 　　　　　　20 　　　　　10.5

　　　　　　RAM 　　　　2200 　　　　　3000　　　　 2000

相关的话音技术还包括静音检测技术和回声消除技术。有研究结果表明，人们在打电话时约有50％为聆听对方讲话的静默时间，10％为讲话时短暂停顿的静默时间。静音检测技术可以有效剔除静默信号，从而使话音信号占用的带宽要求进一步降低到3.5kb/s左右；回声消除技术利用数字滤波器技术来消除对通话质量影响很大回声干扰，保证通话质量。这点在时延相对较大的分组网络环境中尤为重要。

技术规范标准编解码软件符合ITU和3GPP有关标准，通过所有标准测试数据，与标准算法完全兼容。

Voip中的音频Codec技术

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

直播

下载

镜像站

技术资料

Voip中的音频Codec技术

热门文章

最新文章

相关电子书