文档备案控制台

开发者社区问答正文

达摩院语音实验室如何结合SAN-M网络打造新一代的中英自由说语音识别系统？

达摩院语音实验室如何结合SAN-M网络打造新一代的中英自由说语音识别系统？

展开

收起

圆葱猪肉包 2024-08-21 14:52:48 354 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

穿过生命散发芬芳

达摩院语音实验室自研的 SAN-M 网络，打造了达摩院语音实验室新一代的端到端中英自由说语音识别系统。在不需要语种信息的前提下，用一个模型保证纯中文和纯英文相对于单语模型的识别性能基本不降，并且大幅度提升中英文混说场景下的识别性能。

考虑到方言种类比较多，每个专家网络通过简单的两层线性层来建模。进一步我们结合达摩院语音实验室自研的 SAN-M 网络，打造了达摩院语音实验室新一代的端到端方言自由说语音识别系统。在不需要提供方言id的情况下，用一个模型识别十四种常用方言，并且保证纯中文相对于单语模型的识别性能基本不降。

——参考链接。

2024-08-31 07:43:38

赞同展开评论

问答分类：

达摩院智能语音交互智能语音交互

问答标签：

实验室网络网络智能语音交互 san-m网络语音识别实验室智能语音交互实验室网络系统

问答地址：

开发者社区 > 云计算 > 问答

相关问答

通用的中文语音识别系统在遇到方言时面临哪些挑战？

237

1

0

阿里巴巴语音实验室SAN-M网络结构和SCAMA流式Attention机制在语音识别中起什么作用？

1203

1

0

通用的中文语音识别系统在遇到方言时面临哪些挑战？

310

1

0

达摩院语音实验室如何结合SAN-M网络打造新一代的中英自由说语音识别系统？

205

1

0

阿里云语音AI创建的用户，怎么设置权限只能访问语音交互里面的某一个项目？

298

2

0

在阿里语音AI中，语音交互的私有化部署怎么操作？

312

1

0

阿里云语音AI智能语音交互下面的cosyvoice大模型可以免费试用吗？

609

1

0

阿里云语音AI 语音识别 "内电"为啥老识别成"内殿"？已经在阿里云语音库添加"内电"去训练了

184

1

0

阿里语音AI IOT 设备如何接入你们的语音识别？

315

2

0

智能语音交互一句话识别发送语音流结束后返回最终结果可以实时吗

221

1

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

你们能不能简化点购买什么的，一会qoder官网，一会进阿里云。想续费，点了一会来回跳。。。。

什么时候支持本地模型呢？

Qoder 还有Qoderwork都无法添加第三方模型

Qoder 使用体验极差优化！

你们的管理混乱，太垃圾了。

相关文章

阿里云智能语音交互完全对接指南：从开通服务到生产级集成

议题征集！RISC-V 数据中心应用解决方案研讨会邀您参会

大模型微调开源框架推荐

击碎冯·诺依曼瓶颈：汉字编码重构——寻找计算机科学的“圣杯”

龙蜥与玄铁共建 RISC-V 编译器生态：五大 GCC 优化实践解法

相关解决方案

更多

Qwen Audio：打造专属 AI 语音助手

构建视频直播系统

高效构建全球网络服务性能观测体系

LightRAG：轻量级知识图谱RAG系统

构建复杂关系网络的智能洞察分析

还有其他疑问?