Android平台GB28181设备接入侧音频采集推送示例

简介: GB/T28181是广泛应用于视频监控行业的标准协议规范,可以在不同设备之间实现互联互通。今天我们主要探讨Android平台的Audio采集部分。

技术背景

GB/T28181是广泛应用于视频监控行业的标准协议规范,可以在不同设备之间实现互联互通。今天我们主要探讨Android平台的Audio采集部分。


先说如何拿到数据源,在Android平台上采集音频,常用的方式如下:


1. 使用MediaRecorder类:MediaRecorder类提供了一组API,可以用于录制音频。您可以使用MediaRecorder.AudioSource.MIC来源来从麦克风采集音频,并使用MediaRecorder.setOutputFormat()方法设置输出文件格式,使用MediaRecorder.setAudioEncoder()方法设置音频编码等。一旦设置完毕,您可以使用MediaRecorder.prepare()方法准备录制,使用MediaRecorder.start()方法开始录制,使用MediaRecorder.stop()方法停止录制,最后使用MediaRecorder.release()方法释放资源。

2. 使用AudioRecord类:AudioRecord类提供了一组API,可以用于实时采集音频数据。您可以使用AudioRecord.AudioSource.MIC来源来从麦克风采集音频,并设置采样率、声道数、采样精度等参数。一旦配置完毕,您可以使用AudioRecord.read()方法来读取音频数据,并进行处理。

3. 使用第三方SDK:一些第三方SDK也提供了音频采集功能,例如OpenCV、OpenAL等。您可以在这些SDK中寻找适合您需求的音频采集API,并按照其文档进行使用和配置。

技术实现

本文以大牛直播SDK的Android平台GB28181设备接入侧模块为例,这里我们使用的是AudioRecord类完成audio数据源的采集,采集到audio数据,进行PCMA或AAC编码(关于AAC编码,GB/T28181-2022有明确说明)。

7805cf543e3e4ee0b8afed3e97cc3aec.jpg

设置音频编码类型:

    /**
     * Set audio encoder type(设置音频编码类型)
     * 
     * @param type: if with 1:AAC, if with 2: SPEEX, if with 3: PCMA
     * 
     * @return {0} if successful
     */
    public native int SmartPublisherSetAudioCodecType(long handle, int type);


如果是AAC,还可以设置编码码率:

  /**
   * Set audio encoder bit-rate(设置音频编码码率), 当前只对AAC编码有效
   *
   * @param kbit_rate: 码率(单位是kbps), 如果是0的话将使用默认码率, 必须大于等于0
   *
   * @return {0} if successful
   */
  public native int SmartPublisherSetAudioBitRate(long handle, int kbit_rate);


Android工程调用如下:

void CheckInitAudioRecorder() {
        if (audioRecord_ == null) {
            audioRecord_ = new NTAudioRecordV2(this);
        }
        if (audioRecord_ != null) {
            Log.i(TAG, "CheckInitAudioRecorder call audioRecord_.start()+++...");
            audioRecordCallback_ = new NTAudioRecordV2CallbackImpl();
            // audioRecord_.IsMicSource(true);      //如采集音频声音过小,可以打开此选项
            // audioRecord_.IsRemoteSubmixSource(true);
            audioRecord_.AddCallback(audioRecordCallback_);
            audioRecord_.Start(is_pcma_?8000: 44100,1);
            Log.i(TAG, "CheckInitAudioRecorder call audioRecord_.start()---...");
        }
    }


鉴于GB28181会涉及到语音广播和语音对讲,需要打开回音消除设置,还有就是噪音抑制等相关设置。

    /**
     * Set Audio Noise Suppression(设置音频噪音抑制)
     * 
     * @param isNS: if with 1:suppress, if with 0: does not suppress
     * 
     * @return {0} if successful
     */
    public native int SmartPublisherSetNoiseSuppression(long handle, int isNS);
    /**
     * Set Audio AGC(设置音频自动增益控制)
     * 
     * @param isAGC: if with 1:AGC, if with 0: does not AGC
     * 
     * @return {0} if successful
     */
    public native int SmartPublisherSetAGC(long handle, int isAGC);
  /**
   * Set Audio Echo Cancellation(设置音频回音消除)
   *
   * @param isCancel: if with 1:Echo Cancellation, if with 0: does not cancel
   *
   * @param delay: echo delay(ms), if with 0, SDK will automatically estimate the delay.
   *
   * @return {0} if successful
   */
  public native int SmartPublisherSetEchoCancellation(long handle, int isCancel, int delay);


如果需要调整采集端的audio音量,可以用以下接口:

  /**
   * 设置输入音量, 这个接口一般不建议调用, 在一些特殊情况下可能会用, 一般不建议放大音量
   *
   * @param index: 一般是0和1, 如果没有混音的只用0, 有混音的话, 0,1分别设置音量
   *
   * @param volume: 音量,默认是1.0,范围是[0.0, 5.0], 设置成0静音, 1音量不变
   *
   * @return {0} if successful
   */
  public native int SmartPublisherSetInputAudioVolume(long handle, int index, float volume);


编码前audio数据投递接口设置如下:

  /**
   * 传递PCM音频数据给SDK, 每10ms音频数据传入一次
   * 
   *  @param pcmdata: pcm数据, 需要使用ByteBuffer.allocateDirect分配, ByteBuffer.isDirect()是true的才行.
   *  @param size: pcm数据大小
   *  @param sample_rate: 采样率,当前只支持{44100, 8000, 16000, 24000, 32000, 48000}, 推荐44100
   *  @param channel: 通道, 当前通道支持单通道(1)和双通道(2),推荐单通道(1)
   *  @param per_channel_sample_number: 这个请传入的是 sample_rate/100
   */
  public native int SmartPublisherOnPCMData(long handle, ByteBuffer pcmdata, int size, int sample_rate, int channel, int per_channel_sample_number);
  /**
   * 传递PCM音频数据给SDK, 每10ms音频数据传入一次
   *
   *  @param pcmdata: pcm数据, 需要使用ByteBuffer.allocateDirect分配, ByteBuffer.isDirect()是true的才行.
   *  @param offset: pcmdata的偏移
   *  @param size: pcm数据大小
   *  @param sample_rate: 采样率,当前只支持{44100, 8000, 16000, 24000, 32000, 48000}, 推荐44100
   *  @param channel: 通道, 当前通道支持单通道(1)和双通道(2),推荐单通道(1)
   *  @param per_channel_sample_number: 这个请传入的是 sample_rate/100
   */
  public native int SmartPublisherOnPCMDataV2(long handle, ByteBuffer pcmdata, int offset, int size, int sample_rate, int channel, int per_channel_sample_number);
  /**
   * 传递PCM音频数据给SDK, 每10ms音频数据传入一次
   *
   *  @param pcm_short_array: pcm数据, short是native endian order
   *  @param offset: 数组偏移
   *  @param len: 数组项数
   *  @param sample_rate: 采样率,当前只支持{44100, 8000, 16000, 24000, 32000, 48000}, 推荐44100
   *  @param channel: 通道, 当前通道支持单通道(1)和双通道(2),推荐单通道(1)
   *  @param per_channel_sample_number: 这个请传入的是 sample_rate/100
   */
  public native int SmartPublisherOnPCMShortArray(long handle, short[] pcm_short_array, int offset, int len, int sample_rate, int channel, int per_channel_sample_number);
  /**
   * 传递PCM音频数据给SDK, 每10ms音频数据传入一次
   *
   *  @param pcm_float_array: pcm数据
   *  @param offset: 数组偏移
   *  @param len: 数组项数
   *  @param sample_rate: 采样率,当前只支持{44100, 8000, 16000, 24000, 32000, 48000}, 推荐44100
   *  @param channel: 通道, 当前通道支持单通道(1)和双通道(2),推荐单通道(1)
   *  @param per_channel_sample_number: 这个请传入的是 sample_rate/100
   */
  public native int SmartPublisherOnPCMFloatArray(long handle, float[] pcm_float_array, int offset, int len, int sample_rate, int channel, int per_channel_sample_number);
  /**
   * 请参考SmartPublisherOnPCMFloatArray
   */
  public native int SmartPublisherOnPCMFloatNative(long handle, long pcm_float_data, int offset, int len, int sample_rate, int channel, int per_channel_sample_number);
  /**
   * Set far end pcm data
   * 
   * @param pcmdata : 16bit pcm data
   * @param sampleRate: audio sample rate
   * @param channel: auido channel
   * @param per_channel_sample_number: per channel sample numbers
   * @param is_low_latency: if with 0, it is not low_latency, if with 1, it is low_latency
   * @return {0} if successful
   */
  public native int SmartPublisherOnFarEndPCMData(long handle,  ByteBuffer pcmdata, int sampleRate, int channel, int per_channel_sample_number, int is_low_latency);


如何是编码后的audio数据,可以用以下接口投递:

    /**
     * 设置音频数据(AAC/PCMA/PCMU/SPEEX)
     *
     * @param codec_id:
     *
     *  NT_MEDIA_CODEC_ID_AUDIO_BASE = 0x10000,
     *  NT_MEDIA_CODEC_ID_PCMA = NT_MEDIA_CODEC_ID_AUDIO_BASE,
     *  NT_MEDIA_CODEC_ID_PCMU,
     *  NT_MEDIA_CODEC_ID_AAC,
     *  NT_MEDIA_CODEC_ID_SPEEX,
     *  NT_MEDIA_CODEC_ID_SPEEX_NB,
     *  NT_MEDIA_CODEC_ID_SPEEX_WB,
     *  NT_MEDIA_CODEC_ID_SPEEX_UWB,
     *
     * @param data audio数据
     *
     * @param offset data的偏移
     *
     * @param size data length
     *
     * @param is_key_frame 是否I帧, if with key frame, please set 1, otherwise, set 0, audio忽略
     *
     * @param timestamp video timestamp
     *
     * @param parameter_info 用于AAC special config信息填充
     *
     * @param parameter_info_size parameter info size
     *
     * @param sample_rate 采样率,如果需要录像的话必须传正确的值
     *
     *@param channels 通道数, 如果需要录像的话必须传正确的值, 一般是1或者2
     *
     * @return {0} if successful
     */
    public native int SmartPublisherPostAudioEncodedData(long handle, int codec_id,
                                                           ByteBuffer data, int offset, int size,
                                                           int is_key_frame, long timestamp,
                                                           byte[] parameter_info, int parameter_info_size,
                                                           int sample_rate, int channels);


audio数据投递实例:

class NTAudioRecordV2CallbackImpl implements NTAudioRecordV2Callback {
  @Override
  public void onNTAudioRecordV2Frame(ByteBuffer data, int size, int sampleRate, int channel, int per_channel_sample_number) {
    /*
         Log.i(TAG, "onNTAudioRecordV2Frame size=" + size + " sampleRate=" + sampleRate + " channel=" + channel
             + " per_channel_sample_number=" + per_channel_sample_number);
         */
    if (publisherHandle != 0) {
      libPublisher.SmartPublisherOnPCMData(publisherHandle, data, size, sampleRate, channel, per_channel_sample_number);
    }
  }
}


停止Audio采集:

if (audioRecord_ != null) {
  Log.i(TAG, "stopPush, call audioRecord_.StopRecording..");
  audioRecord_.Stop();
  if (audioRecordCallback_ != null) {
    audioRecord_.RemoveCallback(audioRecordCallback_);
    audioRecordCallback_ = null;
  }
  audioRecord_ = null;
}

总结

GB28181设置接入侧,一般采用G.711A律或AAC编码,数据接入可能是直接通过AudioRecord采集,也可以是外部编码后的Audio数据,具体根据场景来选择即可。

相关文章
|
1月前
|
Java Android开发 Swift
安卓与iOS开发对比:平台选择对项目成功的影响
【10月更文挑战第4天】在移动应用开发的世界中,选择合适的平台是至关重要的。本文将深入探讨安卓和iOS两大主流平台的开发环境、用户基础、市场份额和开发成本等方面的差异,并分析这些差异如何影响项目的最终成果。通过比较这两个平台的优势与挑战,开发者可以更好地决定哪个平台更适合他们的项目需求。
109 1
|
2月前
|
IDE Android开发 iOS开发
探索Android与iOS开发的差异:平台选择对项目成功的影响
【9月更文挑战第27天】在移动应用开发的世界中,Android和iOS是两个主要的操作系统平台。每个系统都有其独特的开发环境、工具和用户群体。本文将深入探讨这两个平台的关键差异点,并分析这些差异如何影响应用的性能、用户体验和最终的市场表现。通过对比分析,我们将揭示选择正确的开发平台对于确保项目成功的重要作用。
|
29天前
|
Linux API 开发工具
FFmpeg开发笔记(五十九)Linux编译ijkplayer的Android平台so库
ijkplayer是由B站研发的移动端播放器,基于FFmpeg 3.4,支持Android和iOS。其源码托管于GitHub,截至2024年9月15日,获得了3.24万星标和0.81万分支,尽管已停止更新6年。本文档介绍了如何在Linux环境下编译ijkplayer的so库,以便在较新的开发环境中使用。首先需安装编译工具并调整/tmp分区大小,接着下载并安装Android SDK和NDK,最后下载ijkplayer源码并编译。详细步骤包括环境准备、工具安装及库编译等。更多FFmpeg开发知识可参考相关书籍。
81 0
FFmpeg开发笔记(五十九)Linux编译ijkplayer的Android平台so库
|
3天前
|
搜索推荐 Android开发 开发者
探索安卓开发中的自定义视图:打造个性化UI组件
【10月更文挑战第39天】在安卓开发的世界中,自定义视图是实现独特界面设计的关键。本文将引导你理解自定义视图的概念、创建流程,以及如何通过它们增强应用的用户体验。我们将从基础出发,逐步深入,最终让你能够自信地设计和实现专属的UI组件。
|
5天前
|
Android开发 Swift iOS开发
探索安卓与iOS开发的差异和挑战
【10月更文挑战第37天】在移动应用开发的广阔舞台上,安卓和iOS这两大操作系统扮演着主角。它们各自拥有独特的特性、优势以及面临的开发挑战。本文将深入探讨这两个平台在开发过程中的主要差异,从编程语言到用户界面设计,再到市场分布的不同影响,旨在为开发者提供一个全面的视角,帮助他们更好地理解并应对在不同平台上进行应用开发时可能遇到的难题和机遇。
|
7天前
|
XML 存储 Java
探索安卓开发之旅:从新手到专家
【10月更文挑战第35天】在数字化时代,安卓应用的开发成为了一个热门话题。本文旨在通过浅显易懂的语言,带领初学者了解安卓开发的基础知识,同时为有一定经验的开发者提供进阶技巧。我们将一起探讨如何从零开始构建第一个安卓应用,并逐步深入到性能优化和高级功能的实现。无论你是编程新手还是希望提升技能的开发者,这篇文章都将为你提供有价值的指导和灵感。
|
5天前
|
存储 API 开发工具
探索安卓开发:从基础到进阶
【10月更文挑战第37天】在这篇文章中,我们将一起探索安卓开发的奥秘。无论你是初学者还是有经验的开发者,这篇文章都将为你提供有价值的信息和建议。我们将从安卓开发的基础开始,逐步深入到更复杂的主题,如自定义组件、性能优化等。最后,我们将通过一个代码示例来展示如何实现一个简单的安卓应用。让我们一起开始吧!
|
6天前
|
存储 XML JSON
探索安卓开发:从新手到专家的旅程
【10月更文挑战第36天】在这篇文章中,我们将一起踏上一段激动人心的旅程,从零基础开始,逐步深入安卓开发的奥秘。无论你是编程新手,还是希望扩展技能的老手,这里都有适合你的知识宝藏等待发掘。通过实际的代码示例和深入浅出的解释,我们将解锁安卓开发的关键技能,让你能够构建自己的应用程序,甚至贡献于开源社区。准备好了吗?让我们开始吧!
18 2
|
7天前
|
Android开发
布谷语音软件开发:android端语音软件搭建开发教程
语音软件搭建android端语音软件开发教程!
|
15天前
|
编解码 Java Android开发
通义灵码:在安卓开发中提升工作效率的真实应用案例
本文介绍了通义灵码在安卓开发中的应用。作为一名97年的聋人开发者,我在2024年Google Gemma竞赛中获得了冠军,拿下了很多项目竞赛奖励,通义灵码成为我的得力助手。文章详细展示了如何安装通义灵码插件,并通过多个实例说明其在适配国际语言、多种分辨率、业务逻辑开发和编程语言转换等方面的应用,显著提高了开发效率和准确性。