文档备案控制台

开发者社区问答正文

达摩院语音实验室如何结合SAN-M网络打造新一代的中英自由说语音识别系统？

达摩院语音实验室如何结合SAN-M网络打造新一代的中英自由说语音识别系统？

展开

收起

圆葱猪肉包 2024-08-21 14:52:48 338 版权

版权声明：本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

1 条回答

写回答

取消提交回答

穿过生命散发芬芳

达摩院语音实验室自研的 SAN-M 网络，打造了达摩院语音实验室新一代的端到端中英自由说语音识别系统。在不需要语种信息的前提下，用一个模型保证纯中文和纯英文相对于单语模型的识别性能基本不降，并且大幅度提升中英文混说场景下的识别性能。

考虑到方言种类比较多，每个专家网络通过简单的两层线性层来建模。进一步我们结合达摩院语音实验室自研的 SAN-M 网络，打造了达摩院语音实验室新一代的端到端方言自由说语音识别系统。在不需要提供方言id的情况下，用一个模型识别十四种常用方言，并且保证纯中文相对于单语模型的识别性能基本不降。

——参考链接。

2024-08-31 07:43:38

赞同展开评论

问答分类：

达摩院智能语音交互智能语音交互

问答标签：

网络系统智能语音交互系统 san-m网络语音识别实验室智能语音交互实验室网络系统

问答地址：

开发者社区 > 云计算 > 问答

相关问答

通用的中文语音识别系统在遇到方言时面临哪些挑战？

228

1

0

阿里巴巴语音实验室SAN-M网络结构和SCAMA流式Attention机制在语音识别中起什么作用？

1180

1

0

通用的中文语音识别系统在遇到方言时面临哪些挑战？

297

1

0

达摩院语音实验室如何结合SAN-M网络打造新一代的中英自由说语音识别系统？

193

1

0

阿里云语音AI 语音识别 restful api接口 uniapp h5配置跨域报400，为什么？

382

1

0

智能语音交互，文档上面有动态变量示例，为什么售后说只支持语音文件？

211

0

0

阿里巴巴语音实验室提出的SAN-M网络结构和流式Attention机制在语音识别中起到了什么作用？

406

1

0

阿里云语音AI我有阿里云内容安全的资源包，可以用在智能语音交互上的产品上吗？

218

1

0

modelscope-funasr的实时语音的服务，在阿里云上，是这个实时语音识别的服务嘛？

250

0

0

阿里语音AI IOT 设备如何接入你们的语音识别？

300

2

0

问答排行榜

最热

最新

【大咖问答】对话PostgreSQL 中国社区发起人之一，阿里云数据库高级专家德哥

据说在家办公的程序员是这样写代码的？

如何升级配置

【藏经阁一起读（27）】本周推荐《Apache Flink案例集（2022版）》，你有哪些心得？

【精品问答】python技术1000问(1)

关于国际版和国内版客户端购买套餐问题

【Qoder CN】模型提供商：支持自定义第三方的URL

Pro试用版是只有300的Credits么？

Qoder REPO WIKI使用优化

Qoder Work是个好家伙，但是什么时候能支持自定义模型API？

相关文章

阿里云智能语音交互完全对接指南：从开通服务到生产级集成

议题征集！RISC-V 数据中心应用解决方案研讨会邀您参会

大模型微调开源框架推荐

击碎冯·诺依曼瓶颈：汉字编码重构——寻找计算机科学的“圣杯”

龙蜥与玄铁共建 RISC-V 编译器生态：五大 GCC 优化实践解法

相关解决方案

更多

构建视频直播系统

高效构建全球网络服务性能观测体系

LightRAG：轻量级知识图谱RAG系统

构建复杂关系网络的智能洞察分析

实现跨地域跨账号网络互通

还有其他疑问?