智能语音交互

首页 标签 智能语音交互
# 智能语音交互 #
关注
2337内容
【AI INSIDE大会演讲】阿里云智能达摩院AI产品矩阵
“「人工智能」已经成为了大家耳熟能详的词汇。如今,AI不再只是「能够在围棋比赛中战胜世界冠军」的技术了,人们对于它有了更多的期许。而在AI技术和产业落地产生的商业价值之间存在着必然的鸿沟,如何弥补这一鸿沟,为AI技术的终端用户产生真正的价值?本文中,达摩院机器智能实验室资深算法专家高杰将为大家分享他的观点。”
INTERSPEECH 2022论文解读|Paraformer: 高识别率、高计算效率的单轮非自回归端到端语音识别模型
INTERSPEECH 是由国际语音通讯协会(International Speech Communication Association, ISCA)创办的语音信号处理领域顶级旗舰国际会议。历届 INTERSPEECH 会议都备受全球各地语音语言领域人士的广泛关注。 本文介绍一种具有高识别率与计算效率的单轮非自回归模型 Paraformer。该论文已被 INTERSPEECH 2022 接收。
NLS(Natural Language Processing Service)
NLS(Natural Language Processing Service)是阿里云提供的一项语音识别、语音合成和语音交互等服务的产品,它可以帮助开发者快速实现语音交互应用,并提供了多种语音服务API、SDK和工具,方便开发者进行开发和调试。
【深度学习】深度学习语音识别算法的详细解析
深度学习语音识别算法是一种基于人工神经网络的语音识别技术,其核心在于利用深度神经网络(Deep Neural Network,DNN)自动从语音信号中学习有意义的特征,并生成高效的语音识别模型。以下是对深度学习语音识别算法的详细解析
【技术揭秘】任务型语音对话中的纠错系统
本文主要详细介绍语音对话中的纠错系统。纠错系统旨在对错误的语音识别结果进行鲁棒理解和修正,给业务后续搜索提供更准确的输入,以及改善识别展示结果。
阿里通义音频生成大模型 FunAudioLLM 开源!
声音包含丰富的个体特征及情感情绪信息,对话作为人类最常使用亲切自然的交互模式,是连接人与智能世界至关重要的环节。
免费试用