阿里云智能语音交互服务导览-阿里云开发者社区

阿里云智能语音交互服务导览

2017-07-04 5181

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： 阿里云智能语音交互服务导览

阿里云智能语音交互

产品介绍 & 接口文档
屏幕快照 2017-07-04 下午4.34.38.png

阿里云iDST的智能语音交互服务主要有以下几个大类：

语音识别服务ASR ：将语音转换成文字的能力快速集成，打造出“能听”的应用。
语音合成服务TTS ：将文字转换为声音的能力快速集成，打造出“会说”的应用。
自然语音处理NLU ：集语义解析、智能问答、意图识别等功能于一体，让应用具备理解能力。

语音识别服务ASR：

**在线实时短语音识别：一句话识别

支持流式和非流式的语音识别模式
应用模式: 语音输入法、语音搜索、语音助手等
应用领域：YunOS、支付宝语音搜索、天猫魔盒、手机淘宝、聚划算等

在线实时长语音识别：实时长语音识别

应用领域：直播实时转写、会议记录、语音笔记

在线非实时长语音文件识别：录音文件识别服务

支持单轨/双轨的wav格式、MP3格式的语音文件识别
目前只支持8k和16k的采样率；
支持普通话识别
应用领域：客服质检领域等

语音合成服务TTS：

在线实时语音合成：语音合成

实时播报
应用领域：钉钉语音电话、菜鸟物流信息播报、新闻播报

在线实时语音合成批量工具： TTS批量合成工具

语音合成测试、批量处理
应用领域：有声小说

智能对话平台

智能对话平台: 智能对话平台

智能对话平台，能够让您在这上面快速搭建自己的对话机器人。
应用领域：智能客服、教育、医疗等

自然语音处理NLU：

在线语音识别+自然语音处理：自然语音理解

聊天对话：语音助手就像一个聊天机器人，能和用户直接对话
获取信息：根据用户不同的需要，可以通过语音助手来了解信息，要知天下百事，就问语音助手。
操控手机：能用语音控制手机的操作，打电话、发短信，直接说“打电话给XX”或者“发短信给XX” 非常简便
通过语法、语义、语用的分析，获取自然语言的语义表示。
领域列表：应用、餐厅、休闲娱乐、地图、火车票、飞机票、影院、美食团购、酒店、汽车限行、导航、实时路况、天气、公交站点、地铁站点、热映电影、股票、快递、违章、视频、音乐、优惠券、体育赛事、闹钟、提醒、电视频道

相关实践学习

达摩院智能语音交互 - 声纹识别技术

声纹识别是基于每个发音人的发音器官构造不同，识别当前发音人的身份。按照任务具体分为两种：声纹辨认：从说话人集合中判别出测试语音所属的说话人，为多选一的问题声纹确认：判断测试语音是否由目标说话人所说，是二选一的问题（是或者不是）按照应用具体分为两种：文本相关：要求使用者重复指定的话语，通常包含与训练信息相同的文本（精度较高，适合当前应用模式）文本无关：对使用者发音内容和语言没有要求，受信道环境影响比较大，精度不高本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。讲师介绍：郑斯奇，达摩院算法专家，毕业于美国哈佛大学，研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。

阿里云智能语音交互服务导览

阿里云智能语音交互

语音识别服务ASR：

语音合成服务TTS：

智能对话平台

自然语音处理NLU：

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

阿里云智能语音交互服务导览

阿里云智能语音交互

语音识别服务ASR：

语音合成服务TTS：

智能对话平台

自然语音处理NLU：

热门文章

最新文章

相关课程

相关电子书