【产品解读】2019年度语音AI产品聚焦(上篇)

简介: 2019年是阿里巴巴语音AI再一次突破性增长的一年。这一年,阿里语音AI致力于为客户提供功能全面、开箱即用的智能语音服务,在功能和易用性上都取得了突破性的进展。本文将为大家盘点2019年度阿里语音AI原子能力产品的所有关键词。
来源 阿里语音AI 公众号

2019年是阿里巴巴语音AI再一次突破性增长的一年。这一年,阿里语音AI致力于为客户提供功能全面、开箱即用的智能语音服务,在功能和易用性上都取得了突破性的进展。本文将为大家盘点2019年度阿里语音AI原子能力产品的所有关键词。

自学习平台

1月份,公共云提供自学习平台免费试用功能,使得公共云用户均可以申请和体验语音模型定制功能,在阿里多领域通用模型基础上叠加自己专属模型,自主自助地提升业务识别效果,进一步助力业务取得成功。

2月份,公共云自学习平台定制语言模型POP接口对外发布,提供基于阿里云POP接口进行语言模型定制的能力,为用户提供了与阿里云其他云产品风格统一、易于使用的API接口,帮助客户打通业务系统与公共云服务,提供更为高效、自动化的模型定制能力。

3月份,自学习平台在公共云和本地部署软件上同步支持粤语和英语的模型定制能力,满足客户在方言本地化和国际化场景下更多语种的模型优化需求。

5月份,在本地部署版本已成功落地的基础上,公共云自学习平台声学模型定制内测版正式发布,开始对共创客户邀请制开放,提供界面化声学模型自学习和效果评测相关功能。

产品性能持续性优化

2019年里,我们对阿里语音AI的产品性能进行了持续升级,优化在线计算性能,提升整体系统服务能力,支持各种场景下客户的海量并发请求。

3月,公共云和本地部署软件同时上线新版本char-word-piece-ctc 中英文模型,并发性能提升66%;

7月,快慢自调谐模型正式对外开放,对外提供更高准确率更低延迟的识别服务;

8月,公共云提供了对文件转写服务的分组隔离和细粒度优先级处理,以更细微的控制角度满足用户的特定需求;

12月,快慢自调谐模型、通用基础模型混部上线,大幅提升整体服务利用率,为客户提供了更具弹性、更大负载能力的公共云服务集群。

语音识别方言以及领域模型拓展

为了更好地满足客户在不同方言和领域上的需求,阿里语音AI持续不断地建设和拓展多种方言和领域模型。

目前阿里语音AI已经支持湖南、湖北、河南、山东、山西、陕西、浙江、四川、粤语等15种重口音和方言的转写能力。

在业务领域方面,阿里语音AI目前已经支持了包含客服、金融、出行、演讲、医疗、政务、半远场、物流等在内的11个业务领域。

image.png
多领域识别模型

语音合成音库

1月份,阿里巴巴智能语音在公共云官网上线了语音合成声音定制产品,向客户提供深度定制专属发音人音库的服务,满足客户的个性化需求。

在此基础上,到12月份,公共云共新增17个精品TTS中英发音人,涵盖客服、教育、银行等多个领域,为客户提供总计提供42个声音和更多场景选择。这些精品发音人的音质呈现,远超过了市场竞品的主流发音人,一经推出便迅速获得了用户的认可。这些发音人也可以在本地部署软件中进行使用。

image.png
42个语音合成音色

语音新能力拓展

7月,口语评测公共云内测上线,向教育行业客户提供英语口语评测能力。

8月,声纹识别、语种识别、性别识别开放给种子用户试用。

12月,对话场景下的,实时语种性别功能验证通过,为客户提供了新的交互能力。

在持续提升语音识别和有语音合成功能和体验之外,阿里语音AI也开拓了一些新的语音能力,以邀请制的形式对客户开放,满足用户在更丰富的应用场景下使用的需求。

语音认证体系

8月,阿里云大学智能语音专业认证上线,智能语音培训体系及生态建设进入新阶段:阿里云大学智能语音专业认证,为合作伙伴、终端客户提供了一个标准的系列课程,让用户能够从零开始,一步一步从了解到熟悉,从感知到使用阿里巴巴智能语音的产品和服务。

同样语音认证体系也提供了一个机会使得终端用户可以实现部分岗位工作的转型,例如从普通客服向产品运营、人工智能训练师转型升级。

image.png
智能语音技术认证证书样例

相关文章
|
19天前
|
SQL 存储 人工智能
【产品升级】Dataphin V4.3重大升级:AI“弄潮儿”,数据资产智能化
DataAgent如何助理业务和研发成为业务参谋?如何快速低成本的创建行业数据分类标准?如何管控数据源表的访问权限?如何满足企业安全审计需求?
532 1
【产品升级】Dataphin V4.3重大升级:AI“弄潮儿”,数据资产智能化
|
22天前
|
人工智能
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
33 1
三文带你轻松上手鸿蒙的AI语音03-文本合成声音
|
2月前
|
存储 人工智能 运维
重磅!阿里云可观测产品家族全新升级,AI +数据双驱动,打造全栈可观测体系
近日,阿里云可观测产品家族正式发布云监控 2.0,隶属产品日志服务 SLS、云监控 CMS、应用实时监控服务 ARMS 迎来重磅升级。
325 17
|
29天前
|
消息中间件 人工智能 Cloud Native
|
22天前
|
存储 人工智能 开发者
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
58 0
三文带你轻松上手鸿蒙的AI语音02-声音文件转文本
|
22天前
|
人工智能 语音技术 数据格式
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
24 0
三文带你轻松上手鸿蒙的AI语音01-实时语音识别
|
2月前
|
消息中间件 人工智能 Cloud Native
|
人工智能
大讲堂 | AI产品能力,让AI技术能力更值钱
如果AI技术人员能及早意识到AI产品能力对自己的重要价值,花少量时间系统、高效地提升AI产品能力,对自己的职业发展将非常有利。讲者将在本次大讲堂进行相关分享。
366 0
|
4天前
|
机器学习/深度学习 数据采集 人工智能
AI赋能教育:深度学习在个性化学习系统中的应用
【10月更文挑战第26天】随着人工智能的发展,深度学习技术正逐步应用于教育领域,特别是个性化学习系统中。通过分析学生的学习数据,深度学习模型能够精准预测学生的学习表现,并为其推荐合适的学习资源和规划学习路径,从而提供更加高效、有趣和个性化的学习体验。
37 8
|
2天前
|
人工智能 JSON API
阿里云文档智能 & RAG解决方案:提升AI大模型业务理解与应用
阿里云推出的文档智能 & RAG解决方案,旨在通过先进的文档解析技术和检索增强生成(RAG)方法,显著提升人工智能大模型在业务场景中的应用效果。该方案通过文档智能(Document Mind)技术将非结构化文档内容转换为结构化数据,提取文档的层级树、样式和版面信息,并输出为Markdown和Json格式,为RAG提供语义分块策略。这一过程不仅解决了文档内容解析错误和切块丢失语义信息的问题,还优化了输出LLM友好的Markdown信息。方案的优势在于其多格式支持能力,能够处理包括Office文档、PDF、Html、图片在内的主流文件类型,返回文档的样式、版面信息和层级树结构。
23 2

热门文章

最新文章