智能语音交互

首页 标签 智能语音交互
# 智能语音交互 #
关注
2663内容
Fish Speech 1.5:Fish Audio 推出的零样本语音合成模型,支持13种语言
Fish Speech 1.5 是由 Fish Audio 推出的先进文本到语音(TTS)模型,支持13种语言,具备零样本和少样本语音合成能力,语音克隆延迟时间不到150毫秒。该模型基于深度学习技术如Transformer、VITS、VQVAE和GPT,具有高度准确性和快速合成能力,适用于多种应用场景。
URO-Bench:端到端语音对话模型评测黑马!多语言/多轮/副语言全维度一键开测
URO-Bench 是一款专为端到端语音对话模型设计的全面基准测试工具,涵盖多语言、多轮对话、副语言信息等多维度任务,帮助开发者全面评估模型性能。
|
9月前
|
《解锁鸿蒙系统AI与第三方应用集成的无限可能》
鸿蒙系统与人工智能技术的融合为应用开发带来新机遇。开发者可利用鸿蒙内置的AI服务(如语音助手、视觉识别等),借助DevEcoStudio等智能工具,快速集成AI功能,降低开发成本。遵循鸿蒙接口规范,确保兼容性和稳定性。参与鸿蒙生态社区,提升开发能力并优化用户体验,推动鸿蒙生态繁荣发展。
【技术揭秘】任务型语音对话中的纠错系统
本文主要详细介绍语音对话中的纠错系统。纠错系统旨在对错误的语音识别结果进行鲁棒理解和修正,给业务后续搜索提供更准确的输入,以及改善识别展示结果。
免费试用