备案控制台

开发者社区问答正文

智能语音交互、语音AI中我在使用阿里实时语音识别时，用麦克风录音时，ASR效果就不是很好了，这个是？

智能语音交互、语音AI中我在使用阿里实时语音识别时，用麦克风录音时，MediaRecorder.AudioSource.DEFAULT的ASR效果还行，但是改成MediaRecorder.AudioSource.VOICE_COMMUNICATION，ASR效果就不是很好了，这个是怎么回事呀？

展开

收起

真的很搞笑 2023-05-24 17:41:47 368 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

LittlePenguin

随心分享，欢迎友善交流讨论：）

你好，MediaRecorder.AudioSource.DEFAULT和MediaRecorder.AudioSource.VOICE_COMMUNICATION是两种不同的音频源类型，可能会对语音识别的效果产生影响。具体原因可能与以下几点有关：

音频捕获的地方不同：MediaRecorder.AudioSource.DEFAULT是默认的音频源类型，通常用于普通的录音任务，比如录制音乐、声音等。而MediaRecorder.AudioSource.VOICE_COMMUNICATION是用于语音通信的音频源类型，通常用于VoIP、语音聊天等场景。它们对音频的捕获和处理方式有所不同，可能会对语音识别的效果产生影响。

采样率和码率不同：MediaRecorder.AudioSource.DEFAULT和MediaRecorder.AudioSource.VOICE_COMMUNICATION使用的采样率和码率不同，可能会影响到语音识别的效果。例如，MediaRecorder.AudioSource.VOICE_COMMUNICATION使用的采样率通常比MediaRecorder.AudioSource.DEFAULT更低，可能会导致识别的精度下降。

声音环境不同：MediaRecorder.AudioSource.DEFAULT和MediaRecorder.AudioSource.VOICE_COMMUNICATION通常在不同的声音环境下使用，声音环境的不同可能会对语音识别的效果产生影响。例如，MediaRecorder.AudioSource.VOICE_COMMUNICATION通常在较嘈杂的环境下使用，如果在相对安静的环境下使用，可能会降低识别的准确度。

因此，如果使用MediaRecorder.AudioSource.VOICE_COMMUNICATION时ASR效果不佳，可以尝试调整其他参数，如采样率、码率、降噪等，或者换用其他的音频源类型。另外，对于不同的应用场景，可以选择合适的音频源类型和参数，以提高语音识别的准确度和稳定性。

2023-05-26 13:29:09

赞同展开评论

问答分类：

人工智能语音技术智能语音交互智能语音交互

问答标签：

AI阿里 AI录音 AI语音智能语音交互语音语音AI

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

智能语音交互语音识别如何配置语种模型

115

1

0

智能语音交互管控台创建的语音识别项目包含一句话识别和时实语音识别吗

86

1

0

智能语音交互语音识别服务支持方言识别吗

208

1

0

语音识别 ASR: FunASR、SenseVoice-Small

1031

1

0

在阿里语音AI中，我想问一下智能语音本地部署价格是多少？

146

0

0

阿里语音AI问什么语音转文字，多少录音都转不出来呢？

176

0

0

阿里云语音AI智能语音的合成，多语言的，德语，法语，意大利语这些，可以商用吗？

134

1

0

智能语音交互ASR是否可以识别48KHZ或者44.1HKZ采样率

217

1

0

modelscope-funasr训练一个方言语音识别的大概要录多少小时的录音？

305

2

0

智能语音交互ASR能否在返回汉字时同步返回汉字对应的拼音

141

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

PolarDB这个PXD部署这个端口可以指定吗？

通义灵码启动异常，可点击按钮进行一键修复，如仍无法解决，请参考[问题排查指南](https://he

关于idea lingma欺骗的对话。请开发者尽快修复

怎么搭建本地文生图工作流

通义灵码提示看起来我们今天已经有了很多的对话，我很感谢你的热情，但我现在需要稍微休息一下。提前抱

相关文章

使用 Cursor 进行自动代码调试的实用指南

GPU vs NPU：算力江湖分家又合流，这事儿你真想清楚了吗？

钉钉一口气发20多个新品：Agent OS操作系统让AI从问答走向干活

《游戏场景下伪造内容的识别与处置技术指南》

GPT-5.2 Codex来了：能独立跑7+小时的AI程序员，老金手把手教你玩转

还有其他疑问?