Android平台RTSP轻量级服务|RTMP推送摄像头或屏幕之音频接口设计

简介: 好多开发者在做Android平台录像或者RTSP轻量级服务、RTMP推送相关模块时,对需要设计哪些常用接口会心存疑惑,本文主要以大牛直播SDK(官方)为例,简单介绍下Android平台直播推送SDK所有音频相关的接口,感兴趣的开发者可以看看。

好多开发者在做Android平台录像或者RTSP轻量级服务、RTMP推送相关模块时,对需要设计哪些常用接口会心存疑惑,本文主要以大牛直播SDK(官方)为例,简单介绍下Android平台直播推送SDK所有音频相关的接口,感兴趣的开发者可以看看。


1. 设置audio编码类型,默认AAC,如需更低的码率,可设置SPEEX编码,一把考虑到录像等操作的通用性,建议选择AAC编码。

    /**
     * Set audio encoder type(设置音频编码类型)
     * 
     * @param type: if with 1:AAC, if with 2: SPEEX
     * 
     * @return {0} if successful
     */
    public native int SmartPublisherSetAudioCodecType(long handle, int type);

2. 设置AAC音频编码码率,不再赘述。

  /**
   * Set audio encoder bit-rate(设置音频编码码率), 当前只对AAC编码有效
   *
   * @param kbit_rate: 码率(单位是kbps), 如果是0的话将使用默认码率, 必须大于等于0
   *
   * @return {0} if successful
   */
  public native int SmartPublisherSetAudioBitRate(long handle, int kbit_rate);

3. 设置SPEEX音频编码质量,一般设置到8即可。

    /**
     * Set speex encoder quality(设置speex编码质量)
     * 
     * @param quality: range with (0, 10), default value is 8
     * 
     * @return {0} if successful
     */
    public native int SmartPublisherSetSpeexEncoderQuality(long handle, int quality);

4. 设置噪音抑制,噪音抑制可用于对采集到的audio数据如杂音背景音的消除

    /**
     * Set Audio Noise Suppression(设置音频噪音抑制)
     * 
     * @param isNS: if with 1:suppress, if with 0: does not suppress
     * 
     * @return {0} if successful
     */
    public native int SmartPublisherSetNoiseSuppression(long handle, int isNS);

5. 设置音频自动增益控制,AGC的目的是,系统可根据声音大小自动适当调整音量,使声音大小尽量保持一致

    /**
     * Set Audio AGC(设置音频自动增益控制)
     * 
     * @param isAGC: if with 1:AGC, if with 0: does not AGC
     * 
     * @return {0} if successful
     */
    public native int SmartPublisherSetAGC(long handle, int isAGC);

6. 设置回音消除,用于一对一互动场景下,消除音频回音

  /**
   * Set Audio Echo Cancellation(设置音频回音消除)
   *
   * @param isCancel: if with 1:Echo Cancellation, if with 0: does not cancel
   *
   * @param delay: echo delay(ms), if with 0, SDK will automatically estimate the delay.
   *
   * @return {0} if successful
   */
  public native int SmartPublisherSetEchoCancellation(long handle, int isCancel, int delay);

7. 设置混音,可用于比如两路音频混音场景,具体可参考一对一互动的demo

  /**
   * 设置混音,目前支持两路音频混音
   *
   * @param is_mix: 1混音, 0不混音, 默认不混音
   *
   * @return {0} if successful
   */
  public native int SmartPublisherSetAudioMix(long handle, int is_mix);

8. 实时静音,实时静音顾名思义,推送过程中,暂停音频推送

    /**
     * Set mute or not during publish stream(设置实时静音)
     * 
     * @param isMute: if with 1:mute, if with 0: does not mute
     * 
     * @return {0} if successful
     */
    public native int SmartPublisherSetMute(long handle, int isMute);


9. 用于设置输入音量,范围是[0.0, 5.0],除非麦克风采集到的audio过小,一般不建议放大,放大的话,会引入噪音等

  /**
   * 设置输入音量, 这个接口一般不建议调用, 在一些特殊情况下可能会用, 一般不建议放大音量
   *
   * @param index: 一般是0和1, 如果没有混音的只用0, 有混音的话, 0,1分别设置音量
   *
   * @param volume: 音量,默认是1.0,范围是[0.0, 5.0], 设置成0静音, 1音量不变
   *
   * @return {0} if successful
   */
  public native int SmartPublisherSetInputAudioVolume(long handle, int index, float volume);

10. 对接外部实时采集的PCM数据,考虑到集成方便,我们提供了以下三个接口,注意PCM音频数据接口每10ms传第一次audio数据

  /**
   * 传递PCM音频数据给SDK, 每10ms音频数据传入一次
   * 
   *  @param pcmdata: pcm数据, 需要使用ByteBuffer.allocateDirect分配, ByteBuffer.isDirect()是true的才行.
   *  @param size: pcm数据大小
   *  @param sample_rate: 采样率,当前只支持{44100, 8000, 16000, 24000, 32000, 48000}, 推荐44100
   *  @param channel: 通道, 当前通道支持单通道(1)和双通道(2),推荐单通道(1)
   *  @param per_channel_sample_number: 这个请传入的是 sample_rate/100
   */
  public native int SmartPublisherOnPCMData(long handle, ByteBuffer pcmdata, int size, int sample_rate, int channel, int per_channel_sample_number);
  /**
   * 传递PCM音频数据给SDK, 每10ms音频数据传入一次
   *
   *  @param pcmdata: pcm数据, 需要使用ByteBuffer.allocateDirect分配, ByteBuffer.isDirect()是true的才行.
   *  @param offset: pcmdata的偏移
   *  @param size: pcm数据大小
   *  @param sample_rate: 采样率,当前只支持{44100, 8000, 16000, 24000, 32000, 48000}, 推荐44100
   *  @param channel: 通道, 当前通道支持单通道(1)和双通道(2),推荐单通道(1)
   *  @param per_channel_sample_number: 这个请传入的是 sample_rate/100
   */
  public native int SmartPublisherOnPCMDataV2(long handle, ByteBuffer pcmdata, int offset, int size, int sample_rate, int channel, int per_channel_sample_number);
  /**
   * 传递PCM音频数据给SDK, 每10ms音频数据传入一次
   *
   *  @param pcm_short_array: pcm数据, short是native endian order
   *  @param offset: 数组偏移
   *  @param len: 数组项数
   *  @param sample_rate: 采样率,当前只支持{44100, 8000, 16000, 24000, 32000, 48000}, 推荐44100
   *  @param channel: 通道, 当前通道支持单通道(1)和双通道(2),推荐单通道(1)
   *  @param per_channel_sample_number: 这个请传入的是 sample_rate/100
   */
  public native int SmartPublisherOnPCMShortArray(long handle, short[] pcm_short_array, int offset, int len, int sample_rate, int channel, int per_channel_sample_number);

11. 设置传远端数据,主要用于一对一环境下,拉流端拉到的audio,回调上来,通过推送端这个接口设置下去,完成整体的回音消除

  /**
   * Set far end pcm data
   * 
   * @param pcmdata : 16bit pcm data
   * @param sampleRate: audio sample rate
   * @param channel: auido channel
   * @param per_channel_sample_number: per channel sample numbers
   * @param is_low_latency: if with 0, it is not low_latency, if with 1, it is low_latency
   * @return {0} if successful
   */
  public native int SmartPublisherOnFarEndPCMData(long handle,  ByteBuffer pcmdata, int sampleRate, int channel, int per_channel_sample_number, int is_low_latency);

12. PCM混音音频数据接口,注意,每10ms音频数据传入一次

  /**
   * 传递PCM混音音频数据给SDK, 每10ms音频数据传入一次
   *
   *  @param stream_index: 当前只能传1, 传其他返回错误
   *  @param pcm_data: pcm数据, 需要使用ByteBuffer.allocateDirect分配, ByteBuffer.isDirect()是true的才行.
   *  @param offset: pcmdata的偏移
   *  @param size: pcm数据大小
   *  @param sample_rate: 采样率,当前只支持{44100, 8000, 16000, 24000, 32000, 48000}
   *  @param channels: 通道, 当前通道支持单通道(1)和双通道(2)
   *  @param per_channel_sample_number: 这个请传入的是 sample_rate/100
   */
  public native int SmartPublisherOnMixPCMData(long handle, int stream_index, ByteBuffer pcm_data, int offset, int size, int sample_rate, int channels, int per_channel_sample_number);
  /**
   * 传递PCM混音音频数据给SDK, 每10ms音频数据传入一次
   *
   *  @param stream_index: 当前只能传1, 传其他返回错误
   *  @param pcm_short_array: pcm数据, short是native endian order
   *  @param offset: 数组偏移
   *  @param len: 数组项数
   *  @param sample_rate: 采样率,当前只支持{44100, 8000, 16000, 24000, 32000, 48000}
   *  @param channels: 通道, 当前通道支持单通道(1)和双通道(2)
   *  @param per_channel_sample_number: 这个请传入的是 sample_rate/100
   */
  public native int SmartPublisherOnMixPCMShortArray(long handle, int stream_index, short[] pcm_short_array, int offset, int len, int sample_rate, int channels, int per_channel_sample_number);

13. 用于编码后audio数据对接,主要是转发模块使用

  /**
   * 设置音频数据(AAC/PCMA/PCMU/SPEEX)
   *
   * @param codec_id:
   *
   *  NT_MEDIA_CODEC_ID_AUDIO_BASE = 0x10000,
   *  NT_MEDIA_CODEC_ID_PCMA = NT_MEDIA_CODEC_ID_AUDIO_BASE,
   *  NT_MEDIA_CODEC_ID_PCMU,
   *  NT_MEDIA_CODEC_ID_AAC,
   *  NT_MEDIA_CODEC_ID_SPEEX,
   *  NT_MEDIA_CODEC_ID_SPEEX_NB,
   *  NT_MEDIA_CODEC_ID_SPEEX_WB,
   *  NT_MEDIA_CODEC_ID_SPEEX_UWB,
   *
   * @param data audio数据
   *
   * @param size data length
   *
   * @param is_key_frame 是否I帧, if with key frame, please set 1, otherwise, set 0, audio忽略
   *
   * @param timestamp video timestamp
   *
   * @param parameter_info 用于AAC special config信息填充
   *
   * @param parameter_info_size parameter info size
   *
   * @return {0} if successful
   */
  public native int SmartPublisherPostAudioEncodedData(long handle, int codec_id, ByteBuffer data, int size, int is_key_frame, long timestamp,ByteBuffer parameter_info, int parameter_info_size);
  /**
   * 设置音频数据(AAC/PCMA/PCMU/SPEEX)
   *
   * @param codec_id:
   *
   *  NT_MEDIA_CODEC_ID_AUDIO_BASE = 0x10000,
   *  NT_MEDIA_CODEC_ID_PCMA = NT_MEDIA_CODEC_ID_AUDIO_BASE,
   *  NT_MEDIA_CODEC_ID_PCMU,
   *  NT_MEDIA_CODEC_ID_AAC,
   *  NT_MEDIA_CODEC_ID_SPEEX,
   *  NT_MEDIA_CODEC_ID_SPEEX_NB,
   *  NT_MEDIA_CODEC_ID_SPEEX_WB,
   *  NT_MEDIA_CODEC_ID_SPEEX_UWB,
   *
   * @param data audio数据
   *
   * @param offset data的偏移
   *
   * @param size data length
   *
   * @param is_key_frame 是否I帧, if with key frame, please set 1, otherwise, set 0, audio忽略
   *
   * @param timestamp video timestamp
   *
   * @param parameter_info 用于AAC special config信息填充
   *
   * @param parameter_info_size parameter info size
   *
   * @return {0} if successful
   */
  public native int SmartPublisherPostAudioEncodedDataV2(long handle, int codec_id,
                               ByteBuffer data, int offset, int size,
                               int is_key_frame, long timestamp,
                               byte[] parameter_info, int parameter_info_size);
    /**
     * 设置音频数据(AAC/PCMA/PCMU/SPEEX)
     *
     * @param codec_id:
     *
     *  NT_MEDIA_CODEC_ID_AUDIO_BASE = 0x10000,
     *  NT_MEDIA_CODEC_ID_PCMA = NT_MEDIA_CODEC_ID_AUDIO_BASE,
     *  NT_MEDIA_CODEC_ID_PCMU,
     *  NT_MEDIA_CODEC_ID_AAC,
     *  NT_MEDIA_CODEC_ID_SPEEX,
     *  NT_MEDIA_CODEC_ID_SPEEX_NB,
     *  NT_MEDIA_CODEC_ID_SPEEX_WB,
     *  NT_MEDIA_CODEC_ID_SPEEX_UWB,
     *
     * @param data audio数据
     *
     * @param offset data的偏移
     *
     * @param size data length
     *
     * @param is_key_frame 是否I帧, if with key frame, please set 1, otherwise, set 0, audio忽略
     *
     * @param timestamp video timestamp
     *
     * @param parameter_info 用于AAC special config信息填充
     *
     * @param parameter_info_size parameter info size
     *
     * @param sample_rate 采样率,如果需要录像的话必须传正确的值
     *
     *@param channels 通道数, 如果需要录像的话必须传正确的值, 一般是1或者2
     *
     * @return {0} if successful
     */
    public native int SmartPublisherPostAudioEncodedDataV3(long handle, int codec_id,
                                                           ByteBuffer data, int offset, int size,
                                                           int is_key_frame, long timestamp,
                                                           byte[] parameter_info, int parameter_info_size,
                                                           int sample_rate, int channels);

14. 用于编码后的音频数据回调,方便对接第三方系统

  /**
   * Start output Encoded Data(用于编码后的音视频数据回调)
   *
   * @return {0} if successful
   */
  public native int SmartPublisherStartOutputEncodedData(long handle);
  /**
   *  Stop output Encoded Data
   *
   * @return {0} if successful
   */
  public native int SmartPublisherStopOutputEncodedData(long handle);

总结


细数下来,光audio相关的接口也有20个,可见开发个Android平台RTMP直播推送模块多么麻烦,当然因为本文提到的RTMP推送,实际使用的公司或开发者群体比较大,如果只是项目需求,好多是用不到的,可以适当精简,做个小而美的模块,不失是个很好的选择。

相关文章
|
8天前
|
Android开发
Android MediaTek 平台增加UART接口的红外模块支持,支持NEC红外遥控
Android MediaTek 平台增加UART接口的红外模块支持,支持NEC红外遥控
11 0
|
2月前
|
API 开发工具 Android开发
iOS 和 Android 平台的开发有哪些主要区别?
iOS与Android开发区别:iOS用Objective-C/Swift,App Store唯一下载渠道;Android用Java/Kotlin,多商店发布(如Google Play、华为市场)。设计上,iOS简洁一致,Android灵活可定制。开发工具,iOS用Xcode,Android用Android Studio。硬件和系统多样性,iOS统一,Android复杂。权限管理、审核流程及API各有特点,开发者需依据目标平台特性进行选择。
30 3
|
8天前
|
存储 Linux Android开发
Android存储分区与Rockchip平台的分区命名及U-Boot配置
Android存储分区与Rockchip平台的分区命名及U-Boot配置
13 0
|
8天前
|
存储 安全 Ubuntu
Android 生成平台应用签名keystore文件
Android 生成平台应用签名keystore文件
8 0
|
2月前
|
运维 监控 Java
应用研发平台EMAS产品常见问题之安卓构建版本失败如何解决
应用研发平台EMAS(Enterprise Mobile Application Service)是阿里云提供的一个全栈移动应用开发平台,集成了应用开发、测试、部署、监控和运营服务;本合集旨在总结EMAS产品在应用开发和运维过程中的常见问题及解决方案,助力开发者和企业高效解决技术难题,加速移动应用的上线和稳定运行。
|
8天前
|
消息中间件 网络协议 Java
Android 开发中实现数据传递:广播和Handler
Android 开发中实现数据传递:广播和Handler
13 1
|
10天前
|
Linux 编译器 Android开发
FFmpeg开发笔记(九)Linux交叉编译Android的x265库
在Linux环境下,本文指导如何交叉编译x265的so库以适应Android。首先,需安装cmake和下载android-ndk-r21e。接着,下载x265源码,修改crosscompile.cmake的编译器设置。配置x265源码,使用指定的NDK路径,并在配置界面修改相关选项。随后,修改编译规则,编译并安装x265,调整pc描述文件并更新PKG_CONFIG_PATH。最后,修改FFmpeg配置脚本启用x265支持,编译安装FFmpeg,将生成的so文件导入Android工程,调整gradle配置以确保顺利运行。
32 1
FFmpeg开发笔记(九)Linux交叉编译Android的x265库
|
11天前
|
Unix Linux Shell
FFmpeg开发笔记(八)Linux交叉编译Android的FFmpeg库
在Linux环境下交叉编译Android所需的FFmpeg so库,首先下载`android-ndk-r21e`,然后解压。接着,上传FFmpeg及相关库(如x264、freetype、lame)源码,修改相关sh文件,将`SYSTEM=windows-x86_64`改为`SYSTEM=linux-x86_64`并删除回车符。对x264的configure文件进行修改,然后编译x264。同样编译其他第三方库。设置环境变量`PKG_CONFIG_PATH`,最后在FFmpeg源码目录执行配置、编译和安装命令,生成的so文件复制到App工程指定目录。
43 9
FFmpeg开发笔记(八)Linux交叉编译Android的FFmpeg库
|
1天前
|
机器学习/深度学习 安全 数据处理
构建未来:基于Android的智能家居控制系统开发
【4月更文挑战第29天】 随着物联网技术的蓬勃发展,智能家居已成为现代技术革新的重要领域。本文将深入探讨基于Android平台的智能家居控制系统的设计和实现,旨在提供一种用户友好、高度集成且功能丰富的解决方案。通过利用Android设备的广泛普及和其强大的处理能力,结合最新的无线通讯技术和人工智能算法,我们旨在打造一个可靠、易用且具有高度可定制性的智能家居控制环境。文中不仅详细阐述了系统架构、关键技术选型以及界面设计,还对可能遇到的安全挑战进行了分析,并提出了相应的解决策略。
|
2天前
|
监控 Java Android开发
安卓应用开发:打造高效用户界面的五大策略
【4月更文挑战第29天】 在安卓应用开发的世界中,构建一个既美观又高效的用户界面(UI)对于吸引和保留用户至关重要。本文将深入探讨五种策略,这些策略可以帮助开发者优化安卓应用的UI性能。我们将从布局优化讲起,逐步过渡到绘制优化、内存管理、异步处理以及最终的用户交互细节调整。通过这些实践技巧,你将能够为用户提供流畅而直观的体验,确保你的应用在竞争激烈的市场中脱颖而出。