智能语音交互

首页 标签 智能语音交互
# 智能语音交互 #
关注
2665内容
将人工智能融入多媒体 助力视频产业加速——阿里云视频AI全能力解读
结合人工智能视频理解流程和用户的需求场景,我们将视频AI的功能分成四个大部分,视频智能审核、视频内容理解、视频智能编辑、视频版权保护。其中视频审核功能包括视频鉴黄、暴恐涉政识别、广告二维码识别、无意义直播识别等,利用识别能力将网络上没营养和不健康的视频内容进行排查和处理;视频理解功能包括视频分类、标签,人物识别、语音识别,同时也包括对视频中的文字进行识别(OCR);视频编辑层面可以实现视频首图、视频摘要、视频highlight的生成,同时支持新闻拆条;关于视频版权,支持视频相似性、同源视频检索和音视频指纹等功能。
语音唤醒技术:small-footprint keyword spotting
目前市场上推出了各式各样的音箱、机器人、车载等语音交互产品,语音识别是交互的入口,而语音唤醒成为了踏进这一入口的第一步,如何高效、准确地对用户指令给出反应成为这一技术的最重要目标。iDST资深语音算法工程师陈梦喆将介绍语音唤醒技术的基础知识,基本技术架构以及国内外最新研究成果。
INTERSPEECH 2017系列 | 语音唤醒技术
目前市场上推出了各式各样的音箱,机器人,车载等语音交互产品,语音识别是交互的入口,而语音唤醒成为了踏进这一入口的第一步,如何高效、准确地对用户指令给出反应成为这一技术的最重要目标。本主题将介绍语音唤醒技术的基础知识,基本技术架构以及INTERSPEECH2017上的最新研究成果。
《西部世界》何日来袭?自然语言理解是智能人机对话的关键瓶颈
人工智能如何具备理解用户和懂用户的能力?如何具备与用户自由对话的能力?如何实现主动和渐进式学习的能力……针对这一系列问题,云栖社区采访了阿里云iDST资深算法专家孙健(千诀),采访从人机对话交互中的自然语言理解和人机对话方向展开
【云栖大会】阿里巴巴发布AliGenie 语音开放平台 “智联网”战略又落一子
在2017杭州•云栖大会上,阿里巴巴人工智能实验室发布了AliGenie 开放平台,主要包括三大部分:精灵技能市场、硬件开放平台、行业解决方案,全面赋能智能家居、新制造、新零售、酒店、航空等服务场景。
大咖分享 | 人机交互技术需要什么样的创新?
在由云栖社区和拉勾联合主办的云栖大讲堂第三期——《人机交互技术沙龙》,四位行业专家分享了工业界和学术界在人机交互行业的应用、研究现状,并对未来的发展趋势做出了解读。
自然语言处理多任务学习目标
本文作者通过阅读大量关于自然语言处理多任务的论文,并进行系统的整理分析分类。对于想要了解自然语言处理多任务学习的朋友来说,本文会在理论上给予极大的帮助。
在阿里做博士后是一种怎样的体验?
上个月,阿里巴巴发布2018年博士后招聘启事,针对机器智能、机器学习、数据挖掘、机器人、高性能计算、通信技术、人机交互、物联网等研究方向,邀请海内外博士加入阿里博士后科研工作站。
免费试用