大模型
产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
查看 “
” 全部搜索结果
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
热门
百炼大模型
Modelscope模型即服务
弹性计算
通义灵码
云原生
数据库
云效DevOps
龙蜥操作系统
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
镜像站
开发者社区
ModelScope模型即服务
语音
正文
大家觉得的语音交互模型还有哪些希望上线到modelscope?
大家觉得的语音交互模型还有哪些希望上线到modelscope?
展开
收起
ModelScope运营小助手
2022-10-28 21:00:53
1227
分享
版权
1
条回答
写回答
取消
提交回答
xacgew26naszo
能否有一些语音助手的问答展示的应用啊
2022-10-31 10:55:24
赞同
展开评论
相关问答
语音
智能语音交互语音识别如何配置语种模型
104
1
0
智能语音交互语音识别支持哪些模型
96
1
0
在modelscope-funasr用的paraformer的一个语音识别模型,怎么加上热词?
338
0
0
modelscope-funasr的多说话人语音识别模型 支持实时听写吗?
235
0
0
阿里云语音AI智能语音交互中录音文件识别的customization_id定制模型还是不能区分热词。
129
1
0
为什么自学习平台训练语音识别模型只需要提供文本不需要音频?
55
0
0
阿里云的语音识别服务提供了多个模型以适应不同的应用场景主要包括哪些?
165
1
0
阿里云语音AI智能语音交互下面的cosyvoice大模型可以免费试用吗?
394
1
0
modelscope-funasr分角色语音识别 为什么改成加载本地模型,还是很慢?
139
1
0
modelscope-funasr有没有专门的数字语音识别,最好是离线的模型?
107
1
0
ModelScope模型即服务
语音
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域
我要提问
收录在圈子:
智能语音交互
167
+ 订阅
相关文章
自动生成+语音转写,办公必备!2025年智能会议纪要10+工具!
免费版的配音软件,支持童声男声女声不同声音选项,语音转文字软件推荐支持多种声音
【语音识别】基于K近邻分类算法的语音情感识别(Matlab代码实现)
面向能效和低延迟的语音控制智能家居:离线语音识别与物联网集成方案——论文阅读
基于MFCC(梅尔频率倒谱系数)和GMM(高斯混合模型)的语音识别
热门讨论
热门文章
modelscope上跑报错,提示要pip install ttsfrd,搞不定
funasr 微调没有效果?微调数据量是多少,如何调整batch_size
关于 Windows平台上 ttsfrd 库的问题。
请问下modelscope TTS 如何调整语速语调,用modelscope的pipeline
自动标注模型ttsfrd初始化失败
报错:执行funasr快速推理例子,报错:TypeError: generate() missing
modelscope报错
loss一般能收敛到多少?
怎么使用微调后的模型经行推理?语音识别模型
语音合成speech_sambert-hifigan_tts_zh-cn_16k模型没有使用gpu
展开全部
Dolphin:40语种+22方言!清华联合海天瑞声推出的语音识别大模型,识别精度超Whisper两代
FireRedASR:精准识别普通话、方言和歌曲歌词!小红书开源工业级自动语音识别模型
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
CosyVoice 2.0:阿里开源升级版语音生成大模型,支持多语言和跨语言语音合成,提升发音和音色等的准确性
百聆:集成Deepseek API及语音技术的开源AI语音对话助手,实时交互延迟低至800ms
Step-Audio:开源语音交互新标杆!这个国产AI能说方言会rap,1个模型搞定ASR+TTS+角色扮演
ClearerVoice-Studio:阿里通义开源的语音处理框架,提供语音增强、分离和说话人提取等功能
Kokoro-TTS:超轻量级文本转语音模型,支持生成多种语言和多种语音风格
Zonos:油管博主集体转粉!开源TTS神器Zonos爆火:克隆你的声音说5国语言,还能调喜怒哀乐
Hibiki:实时语音翻译模型打破语言交流障碍!支持将语音实时翻译成其他语言的语音或文本
展开全部
还有其他疑问?
咨询AI助理