Android平台RTMP推送|轻量级RTSP服务如何实现麦克风|扬声器声音采集切换

本文涉及的产品
视觉智能开放平台,图像资源包5000点
视觉智能开放平台,分割抠图1万点
视觉智能开放平台,视频资源包5000点
简介: Android平台扬声器播放声音的采集,在无纸化同屏等场景下,意义很大,早期低版本的Android设备,是没法直接采集扬声器audio的(从Android 10开始支持),所以,如果需要采集扬声器audio,需要先做系统版本判断,添加相应的权限。

技术背景

我们在做Android端同屏的时候,开发者希望可以高版本的Android系统上,在设备支持的前提下,可以采集到扬声器输出的audio,并支持和麦克风采集的audio相互切换,实现无纸化|智慧教室同屏不同audio模式的输出。Android系统出于安全和隐私的考虑,默认并不允许应用程序直接访问系统级别的音频输出。

从Android 10(API级别29)开始,Android引入了媒体投影API(MediaProjection),允许应用捕获屏幕内容以及音频。但是,直接捕获扬声器输出的音频并不是通过MediaProjection API直接实现的,而是通常与屏幕录制功能一起提供。

  • 启用屏幕录制权限:应用需要请求RECORD_AUDIOCAPTURE_AUDIO_OUTPUT权限,以及CAPTURE_VIDEO_OUTPUTCAPTURE_SECURE_VIDEO_OUTPUT(如果捕获安全内容)。
  • 使用MediaProjectionManager:创建一个MediaProjection会话,并引导用户通过系统UI授权屏幕录制。
  • 捕获音频:在录制屏幕时,音频也会同时被捕获。但是,这通常只适用于用户当前正在操作的应用的音频输出,而不是整个系统的音频。

技术实现

本文以大牛直播SDK的SmartServicePublisherV2这个demo为例,介绍下相关的技术实现。

image.gif 编辑

如果需要支持音频播放采集和麦克风采集,可以想把这两个选项打开,然后,通过右侧下拉框,推送过程中,实时切换数据源。

采集麦克风实现逻辑:

/*
 * NTStreamMediaProjectionEngineImpl.java
 * Author: daniusdk.com
 * WeChat: xinsheng120
 *
 * Copyright © 2014~2024 DaniuSDK. All rights reserved.
 */
@Override
public boolean start_audio_record(int sample_rate, int channels) {
    if (audio_record_.get() != null) {
        Log.e(TAG, "start_audio_record audio_record already exists");
        return false;
    }
    if (!check_record_audio_permission()) {
        Log.e(TAG, "start_audio_record RECORD_AUDIO permission is missing");
        return false;
    }
    NTAudioRecordV2 audio_record = new NTAudioRecordV2(get_application_context());
    // audio_record.IsMicSource(true);      //如音频采集声音过小,建议开启
    // audio_record.IsRemoteSubmixSource(true); // Anrdoid 10以下, 有些设备可能能用
   if (!audio_record.Start(sample_rate, channels)) {
       Log.e(TAG, "start_audio_record start failed");
       return false;
   }
    if (audio_record_callback_ != null)
        audio_record.AddCallback(audio_record_callback_);
    NTAudioRecordV2 old = audio_record_.getAndSet(audio_record);
    if (old != null) {
        if (audio_record_callback_ != null)
            old.RemoveCallback(audio_record_callback_);
        old.Stop();
    }
    Log.i(TAG, "start_audio_record ok, sample_rate:" + sample_rate + ", channels:" + channels);
    return true;
}
@Override
public boolean is_audio_record_running() {
    return audio_record_.get() != null;
}
@Override
public void stop_audio_record() {
    NTAudioRecordV2 old = audio_record_.getAndSet(null);
    if (old != null) {
        if (audio_record_callback_ != null)
            old.RemoveCallback(audio_record_callback_);
        old.Stop();
        Log.i(TAG, "call audio_record_.Stop.");
    }
}

image.gif

采集音频播放声音(扬声器)实现逻辑:

/*
 * NTStreamMediaProjectionEngineImpl.java
 * Author: daniusdk.com
 * WeChat: xinsheng120
 *
 * Copyright © 2014~2024 DaniuSDK. All rights reserved.
 */
@Override
public boolean start_audio_playback_capture(int sample_rate, int channels) {
    if (Build.VERSION.SDK_INT < 29) {
        Log.e(TAG, "start_audio_playback_capture Device SDK_INT:" + Build.VERSION.SDK_INT +" < 29(Android 10)");
        return false;
    }
    if (audio_playback_capture_.get() != null) {
        Log.e(TAG, "start_audio_playback_capture capture already exists");
        return false;
    }
    if (!check_record_audio_permission()) {
        Log.e(TAG, "start_audio_playback_capture RECORD_AUDIO permission is missing.");
        return false;
    }
    MediaProjection media_projection = get_media_projection();
    if (null == media_projection) {
        Log.e(TAG, "start_audio_playback_capture media_projection is null");
        return false;
    }
    NTAudioPlaybackCapture capture = new NTAudioPlaybackCapture();
    if (!capture.start(get_application_context(), media_projection, sample_rate, channels)) {
        capture.close();
        Log.e(TAG, "start_audio_playback_capture start failed");
        return false;
    }
    if (audio_playback_capture_callback_ != null)
        capture.register_callback(audio_playback_capture_callback_);
    NTAudioPlaybackCapture old = audio_playback_capture_.getAndSet(capture);
    if (old != null)
        old.close();
    Log.i(TAG, "start_audio_playback_capture ok, sample_rate:" + sample_rate + ", channels:" + channels);
    return true;
}
@Override
public boolean is_audio_playback_capture_running() {
    return audio_playback_capture_.get() != null;
}
@Override
public void stop_audio_playback_capture() {
    NTAudioPlaybackCapture old = audio_playback_capture_.getAndSet(null);
    if (old != null) {
        old.close();
        Log.i(TAG, "stop_audio_playback_capture capture.close.");
    }
}

image.gif

启动RTMP推送或轻量级RTSP服务过程中,切换采集扬声器或者麦克风:

@Override
public boolean set_audio_output_type(int type) {
    if (type < 0 || type > 2) {
        Log.e(TAG, "set_audio_output_type type:" + type + " error");
        return false;
    }
    Runnable r = new Runnable() {
        int type_;
        @Override
        public void run() {
            audio_output_type_ = this.type_;
            Log.i(TAG, "set_audio_output_type value:" + this.type_);
            if (stream_publisher_.is_publishing())
                switch_audio_output_type(audio_output_type_);
        }
        Runnable set(int type) {
            this.type_ = type;
            return this;
        }
    }.set(type);
    post_or_execute(r);
    return true;
}

image.gif

播放效果如下(Android采集屏幕和麦克风|扬声器audio,然后推送到RTMP服务和轻量级RTSP服务),扬声器audio采集,特别是视频播放模式下,比如无纸化同屏过程中,需要放个宣传片,或者一些视频材料,非常方便:

image.gif 编辑

总结

Android平台扬声器播放声音的采集,在无纸化同屏等场景下,意义很大,早期低版本的Android设备,是没法直接采集扬声器audio的(从Android 10开始支持),所以,如果需要采集扬声器audio,需要先做系统版本判断,添加相应的权限。如果需要实时切换扬声器或麦克风声音,可以参考上述实现逻辑,以上是大概的流程,感兴趣的开发者,可以单独跟我沟通讨论。

相关文章
|
8天前
|
弹性计算 人工智能 架构师
阿里云携手Altair共拓云上工业仿真新机遇
2024年9月12日,「2024 Altair 技术大会杭州站」成功召开,阿里云弹性计算产品运营与生态负责人何川,与Altair中国技术总监赵阳在会上联合发布了最新的“云上CAE一体机”。
阿里云携手Altair共拓云上工业仿真新机遇
|
4天前
|
机器学习/深度学习 算法 大数据
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
2024“华为杯”数学建模竞赛,对ABCDEF每个题进行详细的分析,涵盖风电场功率优化、WLAN网络吞吐量、磁性元件损耗建模、地理环境问题、高速公路应急车道启用和X射线脉冲星建模等多领域问题,解析了问题类型、专业和技能的需要。
2464 14
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
|
4天前
|
机器学习/深度学习 算法 数据可视化
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
2024年中国研究生数学建模竞赛C题聚焦磁性元件磁芯损耗建模。题目背景介绍了电能变换技术的发展与应用,强调磁性元件在功率变换器中的重要性。磁芯损耗受多种因素影响,现有模型难以精确预测。题目要求通过数据分析建立高精度磁芯损耗模型。具体任务包括励磁波形分类、修正斯坦麦茨方程、分析影响因素、构建预测模型及优化设计条件。涉及数据预处理、特征提取、机器学习及优化算法等技术。适合电气、材料、计算机等多个专业学生参与。
1505 14
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
|
1月前
|
运维 Cloud Native Devops
一线实战:运维人少,我们从 0 到 1 实践 DevOps 和云原生
上海经证科技有限公司为有效推进软件项目管理和开发工作,选择了阿里云云效作为 DevOps 解决方案。通过云效,实现了从 0 开始,到现在近百个微服务、数百条流水线与应用交付的全面覆盖,有效支撑了敏捷开发流程。
19274 29
|
1月前
|
人工智能 自然语言处理 搜索推荐
阿里云Elasticsearch AI搜索实践
本文介绍了阿里云 Elasticsearch 在AI 搜索方面的技术实践与探索。
18822 20
|
1月前
|
Rust Apache 对象存储
Apache Paimon V0.9最新进展
Apache Paimon V0.9 版本即将发布,此版本带来了多项新特性并解决了关键挑战。Paimon自2022年从Flink社区诞生以来迅速成长,已成为Apache顶级项目,并广泛应用于阿里集团内外的多家企业。
17515 13
Apache Paimon V0.9最新进展
|
6天前
|
编解码 JSON 自然语言处理
通义千问重磅开源Qwen2.5,性能超越Llama
击败Meta,阿里Qwen2.5再登全球开源大模型王座
369 11
|
1月前
|
存储 人工智能 前端开发
AI 网关零代码解决 AI 幻觉问题
本文主要介绍了 AI Agent 的背景,概念,探讨了 AI Agent 网关插件的使用方法,效果以及实现原理。
18698 16
|
3天前
|
算法 Java
JAVA并发编程系列(8)CountDownLatch核心原理
面试中的编程题目“模拟拼团”,我们通过使用CountDownLatch来实现多线程条件下的拼团逻辑。此外,深入解析了CountDownLatch的核心原理及其内部实现机制,特别是`await()`方法的具体工作流程。通过详细分析源码与内部结构,帮助读者更好地理解并发编程的关键概念。
|
3天前
|
SQL 监控 druid
Druid连接池学习
Druid学习笔记,使用Druid进行密码加密。参考文档:https://github.com/alibaba/druid
196 82