文档备案控制台

开发者社区问答正文

在rtc 这个路上做了哪些优化？还有对语音识别，人声模拟方面有什么技术经验？

在rtc 这个路上做了哪些优化？还有对语音识别，人声模拟方面有什么技术经验？

展开

收起

OSC开源社区 2024-05-11 17:29:04 213 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

OSC小助手
1. rtc整个音频引擎音频链路都针对娱乐场景做了优化，如自研回声消除，保证回声消除效果。添加音乐检测，通过检测链路中的音乐，动态根据场景调整相应的优化算法。音乐场景降噪算法保证音乐不受损伤，语音AI降噪消除环境噪音和突发噪音。根据语音与音乐，调整相应的编解码格式和参数，以及jitterbuffer大小，plc算法等。
2. 另外还添加了实时变声、音效等效果。变声主要是依靠pitch shift、调制、失真、tremolo、混响、eq等手段实现，不过这方面没有统一的标准，按照我们定义，实现了小黄人、恶魔、机器人、金属音等之类的变声音效，并能够在rtc场景实时变声
2024-05-11 18:49:51

赞同 1 展开评论

问答分类：

语音技术智能语音交互智能语音交互

问答地址：

开发者社区 > 人工智能 > 问答

相关问答

阿里语音AI的语音识别、语音合成，有没有优化方案？行业专业术语识别和合成效果都不太好

378

3

0

端到端语音识别技术在单语种任务上取得了哪些成果，但在多语种混说场景下存在什么问题？

279

1

0

端到端语音识别技术在单语种任务上取得了哪些成果，但在多语种混说场景下存在什么问题？

198

1

0

智能语音交互识别不准如何优化

288

1

0

modelscope-funasr0.4.4版本进行语音识别，识别的文本有不少断句的错误，怎么优化？

590

0

0

阿里语音AI ASR优化的比如热词：火鸡，设置这个热词，这种优化语音识别可以实现吗?"

282

1

0

智能语音交互，识别效果如何优化

609

4

0

VOD-视频点播有阿里云智能语音交互的技术群吗？

188

2

0

智能语音交互、语音AI中只能看到结果，我想听听录入的原声效果如何，看看哪里可以优化下？

152

1

0

【技术揭秘】可控时延语音识别文本后处理技术

1157

0

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

你们能不能简化点购买什么的，一会qoder官网，一会进阿里云。想续费，点了一会来回跳。。。。

什么时候支持本地模型呢？

Qoder 还有Qoderwork都无法添加第三方模型

Qoder 使用体验极差优化！

你们的管理混乱，太垃圾了。

相关文章

AI数字人系统怎么落地：从内容生产流程看羲和·AI数字人系统的选型与试点

电话语音机器人实时打断怎么测？Barge-in延迟、误触发与状态恢复测试方法

AI 技术在英语教培行业的应用

【北京】贷款、教育行业外呼频繁被封？语音机器人的合规线路与话术配置方案

AIGC 广告素材审核实践：从垂类模型到多模态合规治理

还有其他疑问?