文档备案控制台

开发者社区问答正文

智能语音交互、语音AI中我在使用阿里实时语音识别时，用麦克风录音时，ASR效果就不是很好了，这个是？

智能语音交互、语音AI中我在使用阿里实时语音识别时，用麦克风录音时，MediaRecorder.AudioSource.DEFAULT的ASR效果还行，但是改成MediaRecorder.AudioSource.VOICE_COMMUNICATION，ASR效果就不是很好了，这个是怎么回事呀？

展开

收起

真的很搞笑 2023-05-24 17:41:47 523 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

LittlePenguin

随心分享，欢迎友善交流讨论：）

你好，MediaRecorder.AudioSource.DEFAULT和MediaRecorder.AudioSource.VOICE_COMMUNICATION是两种不同的音频源类型，可能会对语音识别的效果产生影响。具体原因可能与以下几点有关：

音频捕获的地方不同：MediaRecorder.AudioSource.DEFAULT是默认的音频源类型，通常用于普通的录音任务，比如录制音乐、声音等。而MediaRecorder.AudioSource.VOICE_COMMUNICATION是用于语音通信的音频源类型，通常用于VoIP、语音聊天等场景。它们对音频的捕获和处理方式有所不同，可能会对语音识别的效果产生影响。

采样率和码率不同：MediaRecorder.AudioSource.DEFAULT和MediaRecorder.AudioSource.VOICE_COMMUNICATION使用的采样率和码率不同，可能会影响到语音识别的效果。例如，MediaRecorder.AudioSource.VOICE_COMMUNICATION使用的采样率通常比MediaRecorder.AudioSource.DEFAULT更低，可能会导致识别的精度下降。

声音环境不同：MediaRecorder.AudioSource.DEFAULT和MediaRecorder.AudioSource.VOICE_COMMUNICATION通常在不同的声音环境下使用，声音环境的不同可能会对语音识别的效果产生影响。例如，MediaRecorder.AudioSource.VOICE_COMMUNICATION通常在较嘈杂的环境下使用，如果在相对安静的环境下使用，可能会降低识别的准确度。

因此，如果使用MediaRecorder.AudioSource.VOICE_COMMUNICATION时ASR效果不佳，可以尝试调整其他参数，如采样率、码率、降噪等，或者换用其他的音频源类型。另外，对于不同的应用场景，可以选择合适的音频源类型和参数，以提高语音识别的准确度和稳定性。

2023-05-26 13:29:09

赞同展开评论

问答分类：

人工智能语音技术智能语音交互智能语音交互

问答标签：

AI阿里 AI录音 AI语音智能语音交互语音语音AI

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

阿里语音AI问什么语音转文字，多少录音都转不出来呢？

289

0

0

阿里云语音AI asr可以同时用两个模型吗？普通话和粤语同时用？

338

1

0

阿里云语音AI 阿里云asr 容器服务总是不定期出现这个问题帮忙分析一下？

246

0

0

阿里云语音AI智能语音的合成，多语言的，德语，法语，意大利语这些，可以商用吗？

245

1

0

智能语音交互ASR是否可以识别48KHZ或者44.1HKZ采样率

372

1

0

阿里语音AI中asr报错，请看下是什么原因？

247

1

0

modelscope-funasr训练一个方言语音识别的大概要录多少小时的录音？

468

2

0

请教下阿里语音AI，我们用阿里ASR质检遇到一个问题就是：附近的人说话，阿里ASR识别有什么建议么？

347

0

0

智能语音交互ASR能否在返回汉字时同步返回汉字对应的拼音

268

1

0

阿里语音AI中asr起不来，帮忙看下什么原因，服务器重启了，服务起不来了？

200

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

动态变量话术引擎对直播有什么作用？

新手如何进行OSS 图片处理 CDN 加速？

什么年代了，qoder cn还不支持多agent协同一起完成任务

qoder 资源包买完找不到记录也不知道再用，究竟是谁设计的，没见过这样的设计，

需要支持自定义Kimi k3 API

相关文章

阿里云Qoder CN AI编程智能体：重塑开发全流程的智能助手

公鸡母鸡目标检测识别数据集：1,300张图像 | 目标检测分类识别

祁木 CAD Translator：基于阿里云百炼与 DeepSeek 的图纸翻译实战

基于YOLO11的无人机秸秆焚烧检测：从数据标注到云上训练全流程实践

相关解决方案

更多

Qwen Audio：打造专属 AI 语音助手

在聊天系统中增加一个 AI 助手

在 App 上搭建开箱即用的 AI 助手

睿译宝，AI文档翻译排版一步到位

在网站上增加一个 AI 助手

还有其他疑问?