智能语音交互的搜索结果_热门_第14页-阿里云开发者社区

vohelon

|

博文

采样率(sample rate)

# 智能语音交互 # 智能语音交互 # 编解码 # 语音技术

刘旷

|

博文

押注数字人，百度、科大讯飞“短兵相接”

公众对数字人的认知上升到了一个新的台阶。

# 虚拟数字人 # 智能语音交互 # 自然语言处理 # 智能语音交互 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 搜索推荐 # 语音技术 # 区块链 # vr&ar # 图形学 # 信息无障碍 # 计算机视觉

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

EmotiVoice：网易开源AI语音合成黑科技，2000+音色情感可控

EmotiVoice是网易有道开源的多语言语音合成系统，支持中英文2000多种音色，通过提示词控制情感输出，提供Web界面和API接口，具备语音克隆等先进功能。

# 智能语音交互 # 人工智能 # API # 语音技术 # Docker # 容器

阿里云社区

|

博文

|

来自：大数据与机器学习

智能语音交互概述（一）

# 自然语言处理 # 智能语音交互 # 智能语音交互 # 自然语言处理 # 机器人 # 人机交互 # 语音技术 # 智能硬件

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

SpeechGPT 2.0：复旦大学开源端到端 AI 实时语音交互模型，实现 200ms 以内延迟的实时交互

SpeechGPT 2.0 是复旦大学 OpenMOSS 团队推出的端到端实时语音交互模型，具备拟人口语化表达、低延迟响应和多情感控制等功能。

# 智能语音交互 # 智能语音交互 # 人工智能 # 编解码 # 语音技术

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

FireRedASR：精准识别普通话、方言和歌曲歌词！小红书开源工业级自动语音识别模型

小红书开源的工业级自动语音识别模型，支持普通话、中文方言和英语，采用 Encoder-Adapter-LLM 和 AED 架构，实现 SOTA 性能。

# 智能语音交互 # 智能语音交互 # 人工智能 # 物联网 # 测试技术 # 语音技术 # Python

马超伟

|

博文

人工智能：通俗易懂理解深度学习与神经网络

# 自然语言处理 # 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 人工智能 # 算法 # 数据挖掘 # 机器人 # PyTorch # TensorFlow # 语音技术 # 算法框架/工具 # 计算机视觉

刘悦的技术博客

|

博文

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

君不言语音识别技术则已，言则必称Whisper，没错，OpenAi开源的Whisper确实是世界主流语音识别技术的魁首，但在中文领域，有一个足以和Whisper相颉顽的项目，那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraformer非自回归端到端语音识别模型，它具有高精度、高效率、便捷部署的优点，支持快速构建语音识别服务，最重要的是，FunASR支持标点符号识别、低语音识别、音频-视觉语音识别等功能，也就是说，它不仅可以实现语音转写，还能在转写后进行标注，一石二鸟。

# 智能语音交互 # 智能语音交互 # 人工智能 # 达摩院 # 并行计算 # 语音技术 # C++

技术小达人

|

博文

多模态流式 AI 编排平台，大规模减少新应用开发成本

# 智能语音交互 # 资源管理 # 语音服务 # 智能语音交互 # 存储 # 人工智能 # 运维 # 分布式计算 # 算法 # Cloud Native # 定位技术 # 语音技术 # 文件存储 # 云计算

蚝油菜花

|

博文

|

来自： ModelScope模型即服务

Voice-Pro：开源AI音频处理工具，集成转录、翻译、TTS等一站式服务

Voice-Pro是一款开源的多功能音频处理工具，集成了语音转文字、文本转语音、实时翻译、YouTube视频下载和人声分离等多种功能。它支持超过100种语言，适用于教育、娱乐和商业等多个领域，为用户提供一站式的音频处理解决方案，极大地提高工作效率和音频处理的便捷性。

# 智能语音交互 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 算法 # 语音技术

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

智能语音交互