7月7日消息,国际权威研究机构 Gartner 近日公布《云 AI 开发者服务关键能力报告》,阿里在语音语义领域位居全球第二,超越亚马逊 AWS、微软等企业。
其中,阿里在语音识别、语音合成、自然语言理解/处理、文本分析这四项 AI 关键能力评分中获得第一。这是该报告发布以来,中国企业在该领域获得的最好成绩。
*阿里在语音语义领域位居全球第二
*在 AI 关键能力评分中,阿里语音识别及语音合成位列第一
该报告围绕语音语义、计算机视觉、机器学习平台三大维度,对全球云 AI 服务厂商进行评估排名。其中,语音语义领域的评分由语音识别、语音合成、自然语言理解/处理、机器翻译、情感分析、文本分析六项能力组成。
Gartner 认为,到 2025 年,70% 的新应用将集成 AI 模型,云 AI 服务可有效降低 AI 应用的开发门槛。语音语义作为人工智能领域的基础技术,过去几年已拥有诸多技术突破,尤其是以 Bert、Transformer、wav2vec 为代表的预训练模型结构将相关研究推向了高潮,让通用人工智能的实现成为可能。作为最早投入预训练语言模型研究的团队之一,达摩院在阿里云的基础设施之上,研发了深度语言大模型体系 AliceMind,包括通用预训练模型 StructBERT、多语言预训练模型 VECO、超大中文预训练模型 PLUG 等,具备阅读、写作、翻译、问答、搜索、摘要生成、对话等多种能力,该技术体系先后斩获 35 个冠军,并面向全球开发者开源。在智能语音方面,达摩院基于自主研发的 SAN-M 网络结构和 SCAMA 流式端到端语音识别框架,构建了 Universal-ASR 系统,单个系统可以同时满足不同业务场景对延时和准确率的要求,在提升计算效率、降低服务成本的同时,还能将高难度场景中的语音识别错误率降低近三成。同时,达摩院提出并大规模落地应用创新的语音合成技术 SAMBERT, 在情感、韵律、音质等多个维度优化建模,构建了新一代个性化高表现力语音合成框架。目前,达摩院语音语义领域的研究已有 300 多篇论文被国际顶会收录,研究成果已应用于医疗、电力、司法、电商等领域。在最新的 IDC《2021H2 中国 AI 云服务市场研究报告》中,阿里亦斩获了语音和语义公共云市场两项第一。这意味着阿里语音语义在产品技术实力和应用落地上均位居行业前列。