【产品解读】2019年度语音AI产品聚焦(下篇)

简介: 2019年是阿里巴巴语音AI再一次突破性增长的一年。这一年,阿里语音AI致力于为客户提供功能全面、开箱即用的智能语音服务,在功能和易用性上都取得了突破性的进展。在上一篇文章里我们盘点了阿里语音AI在自学习平台、产品性能持续性优化、语音识别方言以及领域模型的拓展、语音合成音库、语音新能力的拓展、语音认证体系等产品及技术上的重点突破,本文将继续盘点阿里语音AI在公共云、本地部署方面取得了哪些重大进展。
来源 阿里语音AI 公众号

2019年是阿里巴巴语音AI再一次突破性增长的一年。这一年,阿里语音AI致力于为客户提供功能全面、开箱即用的智能语音服务,在功能和易用性上都取得了突破性的进展。在上一篇文章里我们盘点了阿里语音AI在自学习平台、产品性能持续性优化、语音识别方言以及领域模型的拓展、语音合成音库、语音新能力的拓展、语音认证体系等产品及技术上的重点突破,本文将继续盘点阿里语音AI在公共云、本地部署方面取得了哪些重大进展。

公共云

新增「阿里巴巴智能语音国际站」
2019年10月份,阿里巴巴智能语音国际站正式对外公测,新加坡站作为第一个Region正式开站;12月份国际站完成公测验收,正式进入对外商用阶段。国际站的建立标志着阿里语音AI迈出了全球化的第一步,开始服务国际客户,让国际业务客户能够在安全合规的前提下,方便地使用阿里巴巴先进的语音能力。

image.png

新增「长文本语音合成产品」
2019年11月,公共云上完成长文本语音合成的全流程验证,正式对外发布。长文本语音合成支持10万字以上的文字合成,支持同步、异步以及流式的使用方式,为资讯类、小说播报类客户提供了更为简单方便的使用体验。

image.png

实现「同等资源下的低成本方案」
2019年度里,语音提供了更丰富的资源包,满足用户不同业务场景下的梯度消费需求。最大化让利,让用户能够以更低成本使用语音服务。目前,公共云已经支持一句话、实时语音识别、录音文件转写、语音合成、长文本语音合成的预付费资源包,并将根据实际情况适当调整资源包的梯度设置。

对齐「阿里云统一产品」
作为阿里云上的公共云产品,阿里语音AI与阿里云的技术要求始终保持一致,为客户提供风格统一和易于使用的接口规范和交互过程。目前系统对外提供了统一的基于POP规范的开放接口,包含自学习平台、文件转写等业务组件;支持标准的RAM、STS配置与试用,提供更加灵活的权限控制方法;提供了上线操作审计、实时消费数据统计等功能,支持应用维度数据统计。

image.png

本地部署软件
阿里语音AI提供轻量化本地部署方案,支持语音识别、语音合成、自学习平台的本地化部署,帮助企业在自己的数据中心零时差使用与阿里云公共云同款的智能语音服务。在2019年,本地部署软件在技术架构、功能、易用性等方面取得了长足进步。
容器化部署
2019年4月,本地部署软件中最后一个组件容器化,这标志着阿里语音AI本地部署软件全面容器化。容器化部署可以大大减少客户学习成本,降低上手难度,提高部署效率,是最适合AI本地部署产品的敏捷实施方案,可以实现一键式部署。在容器化的基础上,目前大部分客户都已经可以单人单天完成独立交付。
多操作系统支持
本地部署软件发布时即可支持centos操作系统;2019年1月,完成redhat操作系统适配;2019年4月,完成window10操作系统适配;2019年8月,完成中标麒麟操作系统适配;2019年10月,完成suse操作系统适配;在2019年,随着产品和业务的进一步发展,本地部署软件能够适配的操作系统越来越多,已可以在司法、政务、银行、保险、物流、教育等多个不同领域的常用操作系统上落地。
产品标准化
2019年8月,集群化部署方案文档完成,为客户大规模部署提供标准方案,自此集群部署、负载均衡均有据可依。2019年10月,《原子能力POC方案》撰写完成,为合作伙伴进行语音识别、语音合成、自学习平台等原子能力的POC提供标准方案;目前,本地部署软件的部署文档、接口文档、产品白皮书、集群部署文档、POC方案等均已齐备。客户可以根据业务需要随时查阅。
授权体系
本地部署软件提供独有的软件授权方式,完全脱离了传统本地部署类软件对于硬件加密狗的依赖,可以方便客户快速的对软件进行授权。2019年2月,授权服务完成对于特殊机型的适配,标志着软件授权技术的成熟和完善。2019年5月,授权流程化建设及说明文档准备完毕。客户可以通过提交审批流程,半自动完成对于本地部署软件的授权;同时,授权注册机需求评审完毕,进入设计开发阶段;2019年8月,授权注册机发布,全面支持“批量采购,按次授权”的“整存零取”式产品售卖方法。客户完成购买并开通注册机后,完全不需要阿里云商务或者产品同学的配合,即可全程自主完成本地部署软件的授权。近两年,语音本地部署软件授权体系,完成了“硬件授权”、“软件手工授权”、“流程半自动授权”、“注册机全自动授权”等数次突破性迭代,大大减少了客户在本地部署软件授权上所耗费的时间和精力,获得了诸多客户的一致好评。

对齐「阿里云统一产品」
2019年12月,语音AI本地部署软件正式接入阿里云专有云,阿里云专有云客户可以简单地通过专有云“购物车”对语音AI本地部署软件买买买。

智能语音产品官网链接:
https://ai.aliyun.com/nls
智能语音国际站链接:
https://www.alibabacloud.com/products/nls?spm=a2796.7919406.1397141.dnavproductai4.72d82d23mFruf0

image.png

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
相关文章
|
9天前
|
机器学习/深度学习 人工智能 编解码
深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
【9月更文挑战第2天】深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
 深入探索AI文生语音技术的奥秘:从文本输入到逼真语音输出的全链条语音合成过程解析
|
5天前
|
消息中间件 人工智能 运维
|
13天前
|
人工智能 分布式计算 DataWorks
大数据&AI产品月刊【2024年8月】
大数据& AI 产品技术月刊【2024年8月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
|
10天前
|
人工智能 Linux iOS开发
AI超强语音转文本SenseVoice,本地化部署教程!
【9月更文挑战第7天】以下是AI超强语音转文本工具SenseVoice的本地化部署教程:首先确保服务器或计算机满足硬件和软件要求,包括处理器性能、内存及操作系统等。接着从官网下载适合的安装包,并按操作系统进行安装。配置音频输入设备和语言模型后,启动SenseVoice并测试其语音转文本功能。最后根据实际使用情况进行优化调整,并定期更新以获取最新功能。详细步骤需参照官方文档。
|
21天前
|
人工智能 自动驾驶 架构师
Gartner 首次发布 AI 代码助手魔力象限,阿里云进入挑战者象限,通义灵码产品能力全面领先
通义灵码由阿里云和通义实验室联合打造,上线不到一年就入围 Gartner 挑战者象限,产品能力得到广泛认可。
|
25天前
|
人工智能 自然语言处理 语音技术
使用AI识别语音和B站视频并通过GPT生成思维导图原创
AI脑图现新增语音及B站视频内容识别功能,可自动生成思维导图。用户可通过发送语音或上传语音文件,系统自动转换为文本并生成结构化的思维导图;对于B站视频,仅需提供链接即可。其工作流程包括:语音转文本、文本结构化、生成Markdown、Markdown转思维导图HTML以及输出最终的思维导图图片给用户。
26 0
|
1月前
|
机器学习/深度学习 人工智能 自然语言处理
|
人工智能 达摩院 算法
达摩院公布语音AI新进展:移动端也能实现逼近真人的语音交互体验
9月18日,在2020云栖大会上,达摩院公布了语音AI技术的最新突破:端上语音识别和语音合成能力首次达到媲美云端的水平,这意味着未来个人用户在移动终端即可轻松体验逼近真人的语音技术。据介绍,达摩院最新的语音技术已在淘宝直播、钉钉会议、高德导航等场景大规模应用,正全面对外开放。
1870 0
达摩院公布语音AI新进展:移动端也能实现逼近真人的语音交互体验
|
4天前
|
机器学习/深度学习 人工智能 搜索推荐
AI与未来医疗:革命性的技术,触手可及的健康
本文探讨了人工智能(AI)在医疗领域的应用及其潜力。从诊断辅助、个性化治疗到药物研发,AI正在改变我们理解健康和疾病的方式。同时,本文也讨论了AI面临的伦理挑战和数据隐私问题,呼吁建立相应的法律法规来保障患者权益。最后,本文对AI在未来医疗中的角色进行了展望,认为AI将继续推动医疗领域的创新和发展。
26 8
|
4天前
|
机器学习/深度学习 人工智能 搜索推荐
AI与未来医疗:革命性的技术,重塑健康格局
本文探讨了人工智能(AI)在医疗领域的应用及其对未来健康的深远影响。通过分析AI在疾病诊断、治疗和预防方面的具体案例,揭示了这一技术如何提升医疗服务的效率和准确性,并展望了AI在未来医疗中的潜力。
21 1

热门文章

最新文章