语音技术

首页 标签 语音技术
# 语音技术 #
关注
6635内容
INTERSPEECH 2017系列 | 语音唤醒技术
目前市场上推出了各式各样的音箱,机器人,车载等语音交互产品,语音识别是交互的入口,而语音唤醒成为了踏进这一入口的第一步,如何高效、准确地对用户指令给出反应成为这一技术的最重要目标。本主题将介绍语音唤醒技术的基础知识,基本技术架构以及INTERSPEECH2017上的最新研究成果。
INTERSPEECH 2017系列 | 远场语音识别技术
编者:今年的INTERSPEECH于8月20日至24日在瑞典的斯德哥尔摩顺利召开,众多的高校研究机构和著名的公司纷纷在本次会议上介绍了各自最新的技术、系统和相关产品,而阿里巴巴集团作为钻石赞助商也派出了强大的阵容前往现场。
特定人语音唤醒简介
特定人语音唤醒,就是通过识别语音中所含的内容和人的身份信息,来实现特定人语音唤醒功能。这是一种较为新颖、具有一定安全性、便捷性和趣味性的功能,同时可以增强个性化体验。
直播内容不合规怎么办?智能AI为您解决审核难题
背景 近些年来,视频直播快速发展,大量的直播平台如雨后春笋一般出现,但是这同样给直播内容的监管带来了巨大的挑战,一方面国家对于直播内容监管的要求日益严格,另一方面相对于文字内容的审核,多媒体内容的审核复杂度更高,资源耗费也更大技术门槛相对也较高,所以这逐渐成为制约直播服务健康发展的一个瓶颈,尤其是对于一些刚刚起步的中小直播平台。
阿里云视频技术专家柿蒂:视频AI in传媒九大业务场景解析
人工智能视觉计算和视频融合在一起能摩擦出怎样的火花呢?柿蒂提到,如同下图所示,人工智能视觉计算可以支持直播、短视频、新闻、体育、影视等多种业务场景,可以实现目标检测识别识、片段侦测、事件识别、鉴黄涉恐、OCR等多种应用层面的功能。
google sdk speech-to-text(谷歌语音转文本、谷歌语音转字幕)
).google sdk speech-to-text ).谷歌语音转文本 ).谷歌语音转字幕 ).谷歌从麦克风实时转字幕 ## 官网文档 - https://cloud.google.com/speech-to-text/docs/quickstart-client-libraries#...
每个产品经理都应该知道的机器学习术语
公司正在上马AI项目?想要熟悉机器学习的世界,想要了解所有关于机器学习的术语,看看本文吧!
免费试用