语音交互编程语言了解一下?

简介: 随着互联网的发展,用户对电子设备的交互行为已经不仅仅局限于触屏点滑操作,语音以其“解放双手”的特性,逐渐成为下一代交互的新形式。近几年来小度音箱等智能设备的普及,越来越多的用户也逐渐认识并熟悉了这种语音对话的形式。

image
随着互联网的发展,用户对电子设备的交互行为已经不仅仅局限于触屏点滑操作,语音以其“解放双手”的特性,逐渐成为下一代交互的新形式。近几年来小度音箱等智能设备的普及,越来越多的用户也逐渐认识并熟悉了这种语音对话的形式。而对于开发者来说,如何低成本的让语言传达到自己的业务场景中并实现视图内的交互就成了一大难题。

百度搜索前端团队在语音交互的探索和开发中,产出了一套语音交互编程语言:VSL,用于帮助开发者们快速低成本的接入语音交互的能力,让语音控制视图内元素的交互成为可能。

那么
1、当下接入语音交互的痛点是什么?

2、你认为语音交互编程语言是什么样的?

3、对于语音交互编程语言的前景,你怎么看?

相关实践学习
达摩院智能语音交互 - 声纹识别技术
声纹识别是基于每个发音人的发音器官构造不同,识别当前发音人的身份。按照任务具体分为两种: 声纹辨认:从说话人集合中判别出测试语音所属的说话人,为多选一的问题 声纹确认:判断测试语音是否由目标说话人所说,是二选一的问题(是或者不是) 按照应用具体分为两种: 文本相关:要求使用者重复指定的话语,通常包含与训练信息相同的文本(精度较高,适合当前应用模式) 文本无关:对使用者发音内容和语言没有要求,受信道环境影响比较大,精度不高 本课程主要介绍声纹识别的原型技术、系统架构及应用案例等。 讲师介绍: 郑斯奇,达摩院算法专家,毕业于美国哈佛大学,研究方向包括声纹识别、性别、年龄、语种识别等。致力于推动端侧声纹与个性化技术的研究和大规模应用。
目录
打赏
0
0
0
1
1392
分享
相关文章
Hibiki:实时语音翻译模型打破语言交流障碍!支持将语音实时翻译成其他语言的语音或文本
Hibiki 是由 Kyutai Labs 开发的实时语音翻译模型,能够将一种语言的语音实时翻译成另一种语言的语音或文本,支持高保真度和低延迟。
133 18
Hibiki:实时语音翻译模型打破语言交流障碍!支持将语音实时翻译成其他语言的语音或文本
Kokoro-TTS:超轻量级文本转语音模型,支持生成多种语言和多种语音风格
Kokoro-TTS 是一款轻量级文本转语音模型,支持多语言和多语音风格生成,具备实时处理能力和低资源占用,适用于多种应用场景。
307 5
Kokoro-TTS:超轻量级文本转语音模型,支持生成多种语言和多种语音风格
《鸿蒙Next:让人工智能语音交互听懂每一种方言和口音》
鸿蒙Next系统通过丰富方言语音数据、优化语音识别模型、引入语音合成技术及用户反馈机制,大幅提升对不同方言和口音的识别能力。具体措施包括多渠道收集方言数据、建立动态数据库、采用深度学习算法、实现多任务学习与对抗训练、生成标准方言样本,并结合硬件如麦克风阵列技术优化语音输入质量。这些综合手段确保了语音交互的准确性和实时性,为用户提供更智能、便捷的服务。
111 16
|
5月前
|
基于surging 如何利用peerjs进行语音视频通话
【9月更文挑战第5天】该内容介绍了如何在基于 Surging 框架的应用中集成 PeerJS 以实现语音视频通话功能。首先需安装 Surging 并引入 PeerJS 库,接着创建 Peer 对象并处理连接事件,然后在 Surging 中创建与 PeerJS 交互的逻辑,最后实现获取媒体设备及建立连接共享媒体流的功能。整个过程需根据具体需求进行调整和优化,并确保通信安全。
100 14
人人交互
人人交互(Human-to-Human Interaction)是指人与人之间通过交流、沟通、
298 2
聊聊智能语音交互系统
智能语音对话系统只是智能对话系统的一个延伸,对了语音输入和语音输出的能力,但核心还是“对话系统”,到底是“智能”还是“智障”还要看这个对话系统提供多少能力,拥有多少技能。
296 0

热门文章

最新文章

AI助理

你好,我是AI助理

可以解答问题、推荐解决方案等