Gartner 报告：阿里语音语义技术全球第二，创中国企业最好成绩-阿里云开发者社区

Gartner 报告：阿里语音语义技术全球第二，创中国企业最好成绩

2023-05-13 617

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 7月7日消息，国际权威研究机构 Gartner 近日公布《云 AI 开发者服务关键能力报告》，阿里在语音语义领域位居全球第二，超越亚马逊 AWS、微软等企业。

7月7日消息，国际权威研究机构 Gartner 近日公布《云 AI 开发者服务关键能力报告》，阿里在语音语义领域位居全球第二，超越亚马逊 AWS、微软等企业。

其中，阿里在语音识别、语音合成、自然语言理解/处理、文本分析这四项 AI 关键能力评分中获得第一。这是该报告发布以来，中国企业在该领域获得的最好成绩。

*阿里在语音语义领域位居全球第二

*在 AI 关键能力评分中，阿里语音识别及语音合成位列第一

该报告围绕语音语义、计算机视觉、机器学习平台三大维度，对全球云 AI 服务厂商进行评估排名。其中，语音语义领域的评分由语音识别、语音合成、自然语言理解/处理、机器翻译、情感分析、文本分析六项能力组成。

Gartner 认为，到 2025 年，70% 的新应用将集成 AI 模型，云 AI 服务可有效降低 AI 应用的开发门槛。语音语义作为人工智能领域的基础技术，过去几年已拥有诸多技术突破，尤其是以 Bert、Transformer、wav2vec 为代表的预训练模型结构将相关研究推向了高潮，让通用人工智能的实现成为可能。作为最早投入预训练语言模型研究的团队之一，达摩院在阿里云的基础设施之上，研发了深度语言大模型体系 AliceMind，包括通用预训练模型 StructBERT、多语言预训练模型 VECO、超大中文预训练模型 PLUG 等，具备阅读、写作、翻译、问答、搜索、摘要生成、对话等多种能力，该技术体系先后斩获 35 个冠军，并面向全球开发者开源。在智能语音方面，达摩院基于自主研发的 SAN-M 网络结构和 SCAMA 流式端到端语音识别框架，构建了 Universal-ASR 系统，单个系统可以同时满足不同业务场景对延时和准确率的要求，在提升计算效率、降低服务成本的同时，还能将高难度场景中的语音识别错误率降低近三成。同时，达摩院提出并大规模落地应用创新的语音合成技术 SAMBERT, 在情感、韵律、音质等多个维度优化建模，构建了新一代个性化高表现力语音合成框架。目前，达摩院语音语义领域的研究已有 300 多篇论文被国际顶会收录，研究成果已应用于医疗、电力、司法、电商等领域。在最新的 IDC《2021H2 中国 AI 云服务市场研究报告》中，阿里亦斩获了语音和语义公共云市场两项第一。这意味着阿里语音语义在产品技术实力和应用落地上均位居行业前列。

相关实践学习

达摩院智能语音交互 - 声纹识别技术

声纹识别是基于每个发音人的发音器官构造不同，识别当前发音人的身份。按照任务具体分为两种：声纹辨认：从说话人集合中判别出测试语音所属的说话人，为多选一的问题声纹确认：判断测试语音是否由目标说话人所说，是二选一的问题（是或者不是）按照应用具体分为两种：文本相关：要求使用者重复指定的话语，通常包含与训练信息相同的文本（精度较高，适合当前应用模式）文本无关：对使用者发音内容和语言没有要求，受信道环境影响比较大，精度不高本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。讲师介绍：郑斯奇，达摩院算法专家，毕业于美国哈佛大学，研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。

Gartner 报告：阿里语音语义技术全球第二，创中国企业最好成绩

阿里云语音AI

热门文章

最新文章

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Gartner 报告：阿里语音语义技术全球第二，创中国企业最好成绩

阿里云语音AI

热门文章

最新文章

相关电子书