PCM音频设备的操作

简介:

 对音频设备的操作主要是初始化音频设备以及往音频设备发送 PCM(Pulse Code Modulation)数据。为了方便,本文使用 ALSA(Advanced Linux Sound Architecture)提供的库和驱动。在编译和运行本文中的 MP3 流媒体播放器的时候,必须先安装 ALSA 相关的文件。
 本文用到的主要对 PCM 设备操作的函数分为 PCM 设备初始化的函数以及 PCM 接口的一些操作函数。
PCM 硬件设备参数设置和初始化的函数有:

 

 
  1. int  snd_pcm_hw_params_malloc (snd_pcm_hw_params_t **ptr)  
  2. int  snd_pcm_hw_params_any (snd_pcm_t *pcm, snd_pcm_hw_params_t *params)  
  3. void snd_pcm_hw_params_free (snd_pcm_hw_params_t *obj)  
  4. int  snd_pcm_hw_params_set_access ( snd_pcm_t *pcm,   
  5.                                     snd_pcm_hw_params_t *params,   
  6.                                     snd_pcm_access_t _access)  
  7. int  snd_pcm_hw_params_set_format ( snd_pcm_t *pcm,   
  8.                                     snd_pcm_hw_params_t *params,   
  9.                                     snd_pcm_format_t val)  
  10. int  snd_pcm_hw_params_set_channels(snd_pcm_t *pcm,   
  11.                                     snd_pcm_hw_params_t *params,   
  12.                                     unsigned int val)  
  13. int snd_pcm_hw_params_set_rate_near(snd_pcm_t *pcm,   
  14.                                     snd_pcm_hw_params_t *params,   
  15.                                     unsigned int *val, int *dir) 

PCM 接口函数有:

 

 
  1. int   snd_pcm_hw_params (snd_pcm_t *pcm, snd_pcm_hw_params_t *params)  
  2. int   snd_pcm_prepare (snd_pcm_t *pcm)  
  3. int   snd_pcm_open (snd_pcm_t **pcm, const char *name,   
  4.                     snd_pcm_stream_t stream, int mode)  
  5. int   snd_pcm_close (snd_pcm_t *pcm)  
  6. snd_pcm_sframes_t   snd_pcm_writei (snd_pcm_t *pcm,   
  7.                     const void *buffer, snd_pcm_uframes_t size) 

这些函数用到了 snd_pcm_hw_params_t 结构,此结构包含用来播放 PCM 数据流的硬件信息配置。在往音频设备(声卡)写入音频数据之前,必须设置访问类型、采样格式、采样率、声道数等。

首先使用 snd_pcm_open () 打开 PCM 设备,在 ALSA 中,PCM 设备都有名字与之对应。比如我们可以定义 PCM 设备名字为 char *pcm_name = "plughw:0,0"。 最重要的 PCM 设备接口是“plughw”以及“hw”接口。 使用“plughw”接口,程序员不必过多关心硬件,而且如果设置的配置参数和实际硬件支持的参数不一致,ALSA 会自动转换数据。如果使用“hw”接口,我们就必须检测硬件是否支持设置的参数了。Plughw 后面的两个数字分别表示设备号和次设备(subdevice)号。

snd_pcm_hw_params_malloc( ) 在栈中分配 snd_pcm_hw_params_t 结构的空间,然后使用 snd_pcm_hw_params_any( ) 函数用声卡的全配置空间参数初始化已经分配的 snd_pcm_hw_params_t 结构。snd_pcm_hw_params_set_access ( ) 设置访问类型,常用访问类型的宏定义有:

 
  1. SND_PCM_ACCESS_RW_INTERLEAVED 

交错访问。在缓冲区的每个 PCM 帧都包含所有设置的声道的连续的采样数据。比如声卡要播放采样长度是 16-bit 的 PCM 立体声数据,表示每个 PCM 帧中有 16-bit 的左声道数据,然后是 16-bit 右声道数据。

 
  1. SND_PCM_ACCESS_RW_NONINTERLEAVED 

非交错访问。每个 PCM 帧只是一个声道需要的数据,如果使用多个声道,那么第一帧是第一个声道的数据,第二帧是第二个声道的数据,依此类推。

函数 snd_pcm_hw_params_set_format() 设置数据格式,主要控制输入的音频数据的类型、无符号还是有符号、是 little-endian 还是 bit-endian。比如对于 16-bit 长度的采样数据可以设置为:

 
  1. SND_PCM_FORMAT_S16_LE      有符号16 bit Little Endian   
  2. SND_PCM_FORMAT_S16_BE      有符号16 bit Big Endian   
  3. SND_PCM_FORMAT_U16_LE      无符号16 bit Little Endian   
  4. SND_PCM_FORMAT_U16_BE      无符号 16 bit Big Endian  
  5. 比如对于 32-bit 长度的采样数据可以设置为:  
  6. SND_PCM_FORMAT_S32_LE      有符号32 bit Little Endian   
  7. SND_PCM_FORMAT_S32_BE      有符号32 bit Big Endian   
  8. SND_PCM_FORMAT_U32_LE      无符号32 bit Little Endian   
  9. SND_PCM_FORMAT_U32_BE      无符号 32 bit Big Endian 

函数 snd_pcm_hw_params_set_channels() 设置音频设备的声道,常见的就是单声道和立体声,如果是立体声,设置最后一个参数为2。snd_pcm_hw_params_set_rate_near () 函数设置音频数据的最接近目标的采样率。snd_pcm_hw_params( ) 从设备配置空间选择一个配置,让函数 snd_pcm_prepare() 准备好 PCM 设备,以便写入 PCM 数据。snd_pcm_writei() 用来把交错的音频数据写入到音频设备。

初始化 PCM 设备的例程如下:

初始化 PCM 设备的例程
 

 
  1. /* open a PCM device */ 
  2. int open_device(struct mad_header const *header)  
  3. {  
  4.    int err;  
  5.    snd_pcm_hw_params_t *hw_params;  
  6.    char  *pcm_name = "plughw:0,0";  
  7.    int rate = header->samplerate;  
  8.    int channels = 2;  
  9.  
  10.    if (header->mode == 0) {  
  11.       channels = 1;  
  12.    } else {  
  13.       channels = 2;  
  14.    }  
  15.  
  16.    if ((err = snd_pcm_open (&playback_handle,   
  17.                             pcm_name, SND_PCM_STREAM_PLAYBACK, 0)) < 0) {  
  18.       printf("cannot open audio device %s (%s)\n",  
  19.       pcm_name,  
  20.       snd_strerror (err));  
  21.       return -1;  
  22.    }  
  23.  
  24.    if ((err = snd_pcm_hw_params_malloc (&hw_params)) < 0) {  
  25.       printf("cannot allocate hardware parameter structure (%s)\n",  
  26.       snd_strerror (err));  
  27.       return -1;  
  28.    }  
  29.  
  30.    if ((err = snd_pcm_hw_params_any (playback_handle, hw_params)) < 0) {  
  31.       printf("cannot initialize hardware parameter structure (%s)\n",  
  32.       snd_strerror (err));  
  33.       return -1;  
  34.    }  
  35.  
  36.  
  37.    if ((err = snd_pcm_hw_params_set_access (playback_handle, hw_params,   
  38.               SND_PCM_ACCESS_RW_INTERLEAVED)) < 0) {  
  39.       printf("cannot set access type (%s)\n",  
  40.       snd_strerror (err));  
  41.       return -1;  
  42.    }  
  43.  
  44.       
  45.    if ((err = snd_pcm_hw_params_set_format (playback_handle,   
  46.               hw_params, SND_PCM_FORMAT_S32_LE)) < 0) {  
  47.       printf("cannot set sample format (%s)\n",  
  48.       snd_strerror (err));  
  49.       return -1;  
  50.    }  
  51.    if ((err = snd_pcm_hw_params_set_rate_near (playback_handle,   
  52.               hw_params, &rate, 0)) < 0) {  
  53.       printf("cannot set sample rate (%s)\n",  
  54.       snd_strerror (err));  
  55.       return -1;  
  56.    }  
  57.  
  58.    if ((err = snd_pcm_hw_params_set_channels (playback_handle,   
  59.               hw_params, channels)) < 0) {  
  60.       printf("cannot set channel count (%s)\n",  
  61.       snd_strerror (err));  
  62.       return -1;  
  63.    }  
  64.  
  65.    if ((err = snd_pcm_hw_params (playback_handle,   
  66.               hw_params)) < 0) {  
  67.       printf("cannot set parameters (%s)\n",  
  68.       snd_strerror (err));  
  69.       return -1;  
  70.    }  
  71.  
  72.    snd_pcm_hw_params_free (hw_params);  
  73.    if ((err = snd_pcm_prepare (playback_handle)) < 0) {  
  74.       printf("cannot prepare audio interface for use (%s)\n",  
  75.       snd_strerror (err));  
  76.       return -1;  
  77.    }  
  78.  
  79.    return 0;  
  80. }  

这里配置的 PCM 格式是 SND_PCM_FORMAT_S32_LE,采样的格式是每个采样有 32-bit 的数据,数据按照 little-endian 存放。如果通过 mad_frame_decode() 函数得到 PCM 数据后,要求每个采样数据只占 16-bit,需要把数据进行MAD的定点类型到 signed short 类型进行转换。那么,PCM 数据如何写入声卡中呢?函数实现例程如下所示:

PCM 数据写入声卡函数实现例程
 

 
  1. while (nsamples--) {  
  2. /* nsamples 是采样的数目 */ 
  3.        signed int sample;  
  4.  
  5.        sample = pcm->samples[0][j];  
  6.        *(OutputPtr++) = sample & 0xff;  
  7.        *(OutputPtr++) = (sample >> 8);  
  8.        *(OutputPtr++) = (sample >> 16);  
  9.        *(OutputPtr++) = (sample >> 24);  
  10.  
  11.        if (nchannels == 2) {  
  12.           sample = pcm->samples[1][j];  
  13.           *(OutputPtr++) = sample  & 0xff;  
  14.           *(OutputPtr++) = sample >> 8;  
  15.           *(OutputPtr++) = (sample >> 16);  
  16.           *(OutputPtr++) = (sample >> 24);  
  17.  
  18.        }  
  19.        j++;  
  20.  
  21.    }  
  22.    if ((err = snd_pcm_writei (playback_handle, buf, samples)) < 0) {  
  23.       err = xrun_recovery(playback_handle, err);  
  24.       if (err < 0) {  
  25.          printf("Write error: %s\n", snd_strerror(err));  
  26.          return -1;  
  27.       }  
  28.    }  

这里用到了 http://www.alsa-project.org/ 关于 ALSA 文档中的例子函数 xrun_recovery( )。详细例子请参见 http://www.alsa-project.org/alsa-doc/alsa-lib/_2test_2pcm_8c-example.html。使用此函数的目的是避免出现由于网络原因,声卡不能及时得到音频数据而使得 snd_pcm_writei() 不能正常连续工作。实际上在 xrun_recovery( ) 中,又调用 snd_pcm_prepare() 和 snd_pcm_resume() 以实现能“恢复错误”的功能。-EPIPE 错误表示应用程序没有及时把 PCM 采样数据送入ASLA 库。xrun_recovery() 函数如下所示:


xrun_recovery() 函数
 

 
  1. int xrun_recovery(snd_pcm_t *handle, int err)  
  2. {  
  3.    if (err == -EPIPE) {    /* under-run */ 
  4.       err = snd_pcm_prepare(handle);  
  5.  
  6.    if (err < 0)  
  7.       printf("Can't recovery from underrun, prepare failed: %s\n",  
  8.          snd_strerror(err));  
  9.       return 0;  
  10.    } else if (err == -ESTRPIPE) {  
  11.       while ((err = snd_pcm_resume(handle)) == -EAGAIN)  
  12.          sleep(1);       /* wait until the suspend flag is released */ 
  13.          if (err < 0) {  
  14.             err = snd_pcm_prepare(handle);  
  15.          if (err < 0)  
  16.             printf("Can't recovery from suspend, prepare failed: %s\n",  
  17.               snd_strerror(err));  
  18.       }  
  19.       return 0;  
  20.    }  
  21.    return err;  
  22. }  

知道了具体的音频设备操作方法,就该使用 MAD 提供的函数具体实现解码了。函数 mp3_decode_buf( ) 提供了使用 libmad 解码的方法。首先调用 mad_stream_buffer() 函数把 MP3 流数据和 decode_stream 关联,然后开始循环解码数据。如果在解码数据过程中,有不完整 PCM 数据帧,那么 decode_stream.error 的值就是 MAD_ERROR_BUFLEN,且 decode_stream.next_frame 不为 NULL。这时候,把剩余的未解码的数据再拷贝到数据解码缓冲区里。 mad_frame_decode( ) 函数从 decode_stream 中得到 PCM 数据。

mad_frame_decode( ) 函数从 decode_stream 中得到 PCM 数据

 
  1. int mp3_decode_buf(char *input_buf, int size)  
  2. {  
  3.   int decode_over_flag = 0;  
  4.   int remain_bytes = 0;  
  5.   int ret_val = 0;  
  6.   mad_stream_buffer(&decode_stream, input_buf, size);  
  7.   decode_stream.error = MAD_ERROR_NONE;  
  8.   while (1)  
  9.   {  
  10.       if (decode_stream.error == MAD_ERROR_BUFLEN) {  
  11.         if (decode_stream.next_frame != NULL) {  
  12.            remain_bytes = decode_stream.bufend - decode_stream.next_frame;  
  13.            memcpy(input_buf, decode_stream.next_frame, remain_bytes);  
  14.            return remain_bytes;  
  15.         }  
  16.       }  
  17.       ret_val = mad_frame_decode(&decode_frame, &decode_stream);  
  18.      /* 省略部分代码 */ 
  19.      ...  
  20.      if (ret_val == 0) {  
  21.          if (play_frame(&decode_frame) == -1) {  
  22.             return -1;  
  23.          }  
  24.       }  
  25.       /* 后面代码省略 */ 
  26.       ...  
  27.    }  
  28.  
  29.    return 0;  
  30. }  

 

recommend from :http://www.ibm.com/developerworks/cn/linux/l-cn-libmadmp3player/index.html




     本文转自 驿落黄昏 51CTO博客,原文链接:http://blog.51cto.com/yiluohuanghun/868048,如需转载请自行联系原作者



相关文章
|
6月前
|
内存技术
SDL播放PCM
SDL播放PCM
40 0
|
内存技术
音频格式G711转PCM的代码
音频格式G711转PCM的代码
290 0
|
API Android开发 内存技术
android 采集PCM音频数据并播放(支持USB摄像头MIC)
android 采集PCM音频数据并播放(支持USB摄像头MIC)
562 0
|
监控 Android开发 开发者
【Android 高性能音频】AAudio 音频流 缓冲区 简介 ( AAudio 音频流内部缓冲区 | 缓冲区帧容量 | 缓冲区帧大小 | 音频数据读写缓冲区 )
【Android 高性能音频】AAudio 音频流 缓冲区 简介 ( AAudio 音频流内部缓冲区 | 缓冲区帧容量 | 缓冲区帧大小 | 音频数据读写缓冲区 )
492 0
【Android 高性能音频】AAudio 音频流 缓冲区 简介 ( AAudio 音频流内部缓冲区 | 缓冲区帧容量 | 缓冲区帧大小 | 音频数据读写缓冲区 )
|
Android开发
【Android 高性能音频】AAudio 音频流 音频设备 相关配置 ( 音频设备ID | 音频流方向 | 音频设备共享模式 )(二)
【Android 高性能音频】AAudio 音频流 音频设备 相关配置 ( 音频设备ID | 音频流方向 | 音频设备共享模式 )(二)
411 0
|
Java API Android开发
【Android 高性能音频】AAudio 音频流 音频设备 相关配置 ( 音频设备ID | 音频流方向 | 音频设备共享模式 )(一)
【Android 高性能音频】AAudio 音频流 音频设备 相关配置 ( 音频设备ID | 音频流方向 | 音频设备共享模式 )(一)
424 0
|
Linux C语言 内存技术
Linux下使用alsa-lib库完成音频开发: 实现放音和录音(从声卡获取PCM数据保存、向声卡写PCM数据输出)
Linux下使用alsa-lib库完成音频开发: 实现放音和录音(从声卡获取PCM数据保存、向声卡写PCM数据输出)
1400 0
|
内存技术
【音视频连载-008】基础学习篇-SDL 播放 PCM 音频文件(下)
接上篇 SDL 播放 PCM 音频文件,已经实现了 推 的模式去播放,接下来看看 拉 的模式如何实现。
211 0
【音视频连载-008】基础学习篇-SDL 播放 PCM 音频文件(下)
|
消息中间件 vr&ar 数据格式
【音视频连载-007】基础学习篇-SDL 播放 PCM 音频文件(上)
在前面的文章中已经能够利用 SDL 去播放 YUV 视频文件了,接下来要通过 SDL 去播放 PCM 音频文件。
579 0
【音视频连载-007】基础学习篇-SDL 播放 PCM 音频文件(上)
|
缓存 C++ 内存技术
C++ 采集音频流(PCM裸流)实现录音功能
与上一篇的“C++ 播放音频流(PCM裸流)” 点击打开链接 相对应,本篇是关于用C++实现录音功能的。同样是直接建一个win32控制台程序然后将代码拷过去改个文件名就可以用,也可以下载本人上传的相关工程,这个工程是用VS2013写的,如果是较低的版本就呵呵了。
2572 0