Voip中的音频Codec技术

简介: Voip中的音频Codec技术

持续创作,加速成长!这是我参与「掘金日新计划 · 6 月更文挑战」的第34天,点击查看活动详情


TU G.729(CS-ACELP共扼结构-代数码激励线性预测)语音算法 ITU规定的G.729标准语音处理算法(标准见附),编码速率是8kbps,采样率8KHz,编码延时一帧10ms。其编码语音质量与传统电话接近,是VoIP系统中常用的基础算法。附录A和附录B称作G.729A和G.729B。


G.729现在经进一步的研究和实践将其工作范围扩展至 6.4~11.8kb/s,话音质量也在此范围内有一定的变化,但即使是6.4kb/s,话音质量也还不错,因而很适合在VoIP系统中使用。


ITU G.723.1(ACELP代数码激励线性预测)语音算法 ITU规定的G.723.1标准语音处理算法(标准见附),编码速率有是5.3和6.3kbps两种,采样率8KHz,编码延时一帧30ms。其编码语音质量与G.729接近,是VoIP和数字录音系统中常用的基础算法。附录A称作G.723.1A。


AMR(Adaptive Multi Rate)自适应多速率语音算法 AMR 是ETSI和3GPP等组织规定的GSM,3G,W-CDMA等无线通信系统必须支持的一种标准语音处理算法(标准见附),它的编码速率范围是从4.75 -12.2kbps,采样率8KHz,编码延时一帧20ms。可以根据网络条件在不同的速率之间切换。手机彩铃,彩信,录音,3GP格式等一般都是使用这 种算法,与MP3格式可以互相转换。


AMR Wideband(Adaptive Multi Rate)宽带自适应多速率语音算法 AMR Wideband是3GPP规定的宽带AMR算法(标准见附),在ITU标准中规定为G.722.2,其采样率为16KHz,编码速率范围为6.6-23.85kbps,编码延时一帧20ms,主要应用在3G通信系统。

G.722 (SB-ADPCM)


ITU G.722 于 1988 年标准化,是第一个用于 16 KHZ 采样率的标准化宽带语音编码算法。该编解码器将 16 KHZ 的频带分为两个子频带,并用 ADPCM 算法在子频带中进行编码。其总延迟约 3 ms,这已经很小,不致造成电信网络中的回声问题。此外,该编解码器传输位误差率仅为 10-3,其性能可以接受。即使遇到最差的网络传输条件,上述要求也可确保性能只是稍稍下降。


G.722 编解码器在 16 kHz 频率上接收 16 位数据(带宽从 50 Hz 至 7 kHz),并将其压缩为 64、56 与 48 Kbit/s。

G.722.1(转换 (Transform) 编码器)


ITU G.722.1 于 20 世纪 90 年代末开发,可实现比 G.722 编解码器更低的比特率以及更大的压缩。目标是以大约一半的比特率实现与 G.722 大致相当的质量。该编解码器由 Picturetel 开发,使用了转换编码的方法。其在 16 KHZ 频率上接收 16 位数据(带宽从 50 Hz 至 7 kHz),并将其压缩为 32 与 24 Kbits/s。目前大多用于电视会议系统。

G.722.2 (AMR-WB)


AMR-WB 是一种最初为 GSM 无线网络定义的宽带编解码器,但最近扩展为包括有线系统。由于其计算强度很大,因此要充分利用多年来显著提高的 DSP 处理能力。AMR-WB 建立在 CELP 语音编码器基础上,音频带宽为 50-7000 HZ,在 6.6 至 23.85 Kbit/s 间提供 9 种语音编码。


AMR-WB 于 2001 年标准化,用于 GSM 与 WCDMA 网络。2002 年底,ITU 决定它还将作为有线应用的宽带标准。它是第一个具有双重应用范围的编解码器。

表1 几种话音编解码方法的性能对比

             编码方法     G.723.1    G.729    G.729A

              比特率    5.3/6.3kb/s   8kb/s    8kb/s

              帧长度    30ms      10ms     10ms

             处理时延   30ms      10ms     10ms

              观看时延   7.5ms      5ms     5ms

              帧字节数   20/24      10      10

             DSP MIP   16       20      10.5

              RAM     2200      3000     2000


相关的话音技术还包括静音检测技术和回声消除技术。有研究结果表明,人们在打电话时约有50%为聆听对方讲话的静默时间,10%为讲话时短暂停顿的静 默时间。静音检测技术可以有效剔除静默信号,从而使话音信号占用的带宽要求进一步降低到3.5kb/s左右;回声消除技术利用数字滤波器技术来消除对通话 质量影响很大回声干扰,保证通话质量。这点在时延相对较大的分组网络环境中尤为重要。


技术规范 标准编解码软件符合ITU和3GPP有关标准,通过所有标准测试数据,与标准算法完全兼容。



相关文章
|
6月前
|
编解码 安全 索引
媒体编解码器MediaCodec
媒体编解码器MediaCodec
218 0
|
6月前
|
Web App开发 流计算 内存技术
安防领域常用的视频流协议介绍
安防领域常用的视频流协议介绍
357 0
|
编解码 网络协议 安全
一文看懂音视频流媒体协议及信令技术
音视频通信完整流程有如下几个环节:采集、编码、前后处理、传输、解码、缓冲、渲染等。 每一个细分环节,还有更细分的技术模块。比如,前后处理环节有美颜、滤镜、回声消除、噪声抑制等,采集有麦克风阵列等,编解码有H.263,H.264、H.265等,传输就涉及到了本文重点介绍的RTSP/RTMP/RTP/RTCP等流媒体协议以及相关的信令技术。
一文看懂音视频流媒体协议及信令技术
|
6月前
|
编解码 Linux C语言
实现一个传输aac音频的rtsp服务器
实现一个传输aac音频的rtsp服务器
92 0
|
编解码 开发工具 开发者
如何支持RTSP播放H.265(HEVC)流
随着H.265的普及,越来越多的开发者希望大牛直播SDK能支持低延迟的RTSP H.265播放,并分享相关经验: 实现思路: 对rtsp来说,要播放h265只要正确解析sdp和rtp包即可. 下面对这些相关内容做一些介绍.
446 1
|
编解码 Linux 开发工具
C++实现RTMP协议发送H.264编码及AAC编码的音视频,摄像头直播
C++实现RTMP协议发送H.264编码及AAC编码的音视频,摄像头直播
282 0
|
测试技术
如何使用AMR M分析rtp流中的amr语音
笔者分享最近找到一款amr工具amr master。该工具结合wireshark可以网卡包中的amr语音流转出.amr文件,采用vlc player可以进行播放。
如何使用AMR M分析rtp流中的amr语音
|
编解码 网络性能优化 网络协议
|
数据采集 传感器 编解码
【Android RTMP】安卓直播推流总结 ( 直播服务器搭建 | NV21 图像采集 | H.264 视频编码 | PCM 音频采集 | AAC 音频编码 | RTMP 包封装推流 )
【Android RTMP】安卓直播推流总结 ( 直播服务器搭建 | NV21 图像采集 | H.264 视频编码 | PCM 音频采集 | AAC 音频编码 | RTMP 包封装推流 )
1490 0
【Android RTMP】安卓直播推流总结 ( 直播服务器搭建 | NV21 图像采集 | H.264 视频编码 | PCM 音频采集 | AAC 音频编码 | RTMP 包封装推流 )
FFMPEG音频视频开发:QT采集摄像头数据帧与声卡音频通过FFMPEG实时推流到RTMP服务器(v1.0)
FFMPEG音频视频开发:QT采集摄像头数据帧与声卡音频通过FFMPEG实时推流到RTMP服务器(v1.0)
885 0