文档备案控制台

开发者社区问答正文

在rtc 这个路上做了哪些优化？还有对语音识别，人声模拟方面有什么技术经验？

在rtc 这个路上做了哪些优化？还有对语音识别，人声模拟方面有什么技术经验？

展开

收起

OSC开源社区 2024-05-11 17:29:04 199 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

OSC小助手
1. rtc整个音频引擎音频链路都针对娱乐场景做了优化，如自研回声消除，保证回声消除效果。添加音乐检测，通过检测链路中的音乐，动态根据场景调整相应的优化算法。音乐场景降噪算法保证音乐不受损伤，语音AI降噪消除环境噪音和突发噪音。根据语音与音乐，调整相应的编解码格式和参数，以及jitterbuffer大小，plc算法等。
2. 另外还添加了实时变声、音效等效果。变声主要是依靠pitch shift、调制、失真、tremolo、混响、eq等手段实现，不过这方面没有统一的标准，按照我们定义，实现了小黄人、恶魔、机器人、金属音等之类的变声音效，并能够在rtc场景实时变声
2024-05-11 18:49:51

赞同 1 展开评论

问答分类：

语音技术智能语音交互智能语音交互

问答标签：

智能语音交互技术

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

阿里语音AI的语音识别、语音合成，有没有优化方案？行业专业术语识别和合成效果都不太好

364

3

0

端到端语音识别技术在单语种任务上取得了哪些成果，但在多语种混说场景下存在什么问题？

264

1

0

端到端语音识别技术在单语种任务上取得了哪些成果，但在多语种混说场景下存在什么问题？

183

1

0

智能语音交互识别不准如何优化

271

1

0

modelscope-funasr0.4.4版本进行语音识别，识别的文本有不少断句的错误，怎么优化？

575

0

0

阿里语音AI ASR优化的比如热词：火鸡，设置这个热词，这种优化语音识别可以实现吗?"

272

1

0

智能语音交互，识别效果如何优化

597

4

0

VOD-视频点播有阿里云智能语音交互的技术群吗？

179

2

0

智能语音交互、语音AI中只能看到结果，我想听听录入的原声效果如何，看看哪里可以优化下？

138

1

0

【技术揭秘】可控时延语音识别文本后处理技术

1144

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

关于国际版和国内版客户端购买套餐问题

【Qoder CN】模型提供商：支持自定义第三方的URL

Pro试用版是只有300的Credits么？

Qoder REPO WIKI使用优化

Qoder Work是个好家伙，但是什么时候能支持自定义模型API？

相关文章

出海业务多语言云客服系统技术白皮书：工单国际化、知识库同步与跨区域坐席协同的架构设计与实现

当"拟人化"退潮，留下来的是能证明"这是真人说的"系统

Synerow AI Agent架构解析：意图识别、工具调用与工单闭环

AI英语教培系统的开发

AI英语学习智能体的开发费用

还有其他疑问?