产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
百炼大模型
Modelscope模型即服务
弹性计算
云原生
数据库
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
物联网
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
开发者社区
>
ModelScope模型即服务
>
语音
>
正文
大家觉得的语音交互模型还有哪些希望上线到modelscope?
大家觉得的语音交互模型还有哪些希望上线到modelscope?
展开
收起
ModelScope运营小助手
2022-10-28 21:00:53
1170
0
1
条回答
写回答
取消
提交回答
xacgew26naszo
能否有一些语音助手的问答展示的应用啊
2022-10-31 10:55:24
赞同
展开评论
打赏
相关问答
语音
在modelscope-funasr用的paraformer的一个语音识别模型,怎么加上热词?
110
0
0
modelscope-funasr的多说话人语音识别模型 支持实时听写吗?
66
0
0
阿里云语音AI智能语音交互中录音文件识别的customization_id定制模型还是不能区分热词。
37
1
0
为什么自学习平台训练语音识别模型只需要提供文本不需要音频?
20
0
0
阿里云的语音识别服务提供了多个模型以适应不同的应用场景主要包括哪些?
47
1
0
阿里云语音AI智能语音交互下面的cosyvoice大模型可以免费试用吗?
134
1
0
modelscope-funasr分角色语音识别 为什么改成加载本地模型,还是很慢?
61
1
0
导出ONNX类型模型后,modelscope-funasr能运行这个导出的模型吗?
64
0
0
modelscope-funasr有没有专门的数字语音识别,最好是离线的模型?
40
1
0
modelscope-funasr部署的离线语音服务不支持 cam这种模型么 ?
55
0
0
ModelScope模型即服务
语音
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域
我要提问
相关产品
智能语音交互
文档详情
产品详情
热门讨论
热门文章
modelscope上跑报错,提示要pip install ttsfrd,搞不定
7933
关于 Windows平台上 ttsfrd 库的问题。
1831
No module named 'ttsfrd'
1430
在Windows平台上关于 ModelScorpe Audio 安装涉及 kwsbp 的问题
655
KeyError: 'asr-inference is not in the pipelines r
2066
modelscope 更新指定版本
433
PyTorch Transformer 英中翻译超详细教程
963
目录空间都删的只剩2G了,还报OSError: [Errno 122] Disk quota exc
1053
自动标注模型ttsfrd初始化失败
1130
关于 modelscope-funasr 报错的问题。
1033
展开全部
CosyVoice 2.0:阿里开源升级版语音生成大模型,支持多语言和跨语言语音合成,提升发音和音色等的准确性
272
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
77
ClearerVoice-Studio:阿里通义开源的语音处理框架,提供语音增强、分离和说话人提取等功能
149
Freestyler:微软联合西工大和香港大学推出说唱音乐生成模型,支持控制生成的音色、风格和节奏等
74
KAN-TTS 在 conda 环境下无法安装 ttsfrd
1275
智能降噪
1115
Fish Speech 1.5:Fish Audio 推出的零样本语音合成模型,支持13种语言
94
ChatTTSPlus:开源文本转语音工具,支持语音克隆,是 ChatTTS 的扩展版本
65
kws_util 下载不了
79
Clone-voice:开源的声音克隆工具,支持文本转语音或改变声音风格,支持16种语言
92
展开全部
相关课程
更多
ModelScope社区Library技术架构介绍
229
1
去学习
达摩院智能语音交互 - 人机对话技术浅析
154
4
去学习
达摩院智能语音交互 - 声纹识别技术
2868
4
去学习
阿里巴巴智能语音交互技术与应用
7247
7
去学习
达摩院智能语音交互 - 语音识别技术
313
4
去学习
达摩院智能语音交互 - 语音合成技术
585
4
去学习
相关文章
CosyVoice 2.0:阿里开源升级版语音生成大模型,支持多语言和跨语言语音合成,提升发音和音色等的准确性
MarkItDown:微软开源的多格式转Markdown工具,支持将PDF、Word、图像和音频等文件转换为Markdown格式
AI在自然语言处理中的突破:从理论到应用
多模态实时交互大模型浦语·灵笔 2.5 OmniLive开源:能看、能听、会记、会说!
【最佳实践系列】高并发调用百炼语音合成大模型
相关电子书
更多
万物互联语音交互从端开始——前端处理从技术到商业
立即下载
阿里云总监课第二期——Neural Network Language Model在语音识别中的应用
立即下载
阿里云总监课第二期——IoT时代的语音交互智能
立即下载
相关实验场景
更多
【涂鸦即艺术】基于云应用开发平台CAP部署AI实时生图绘板
77
1.0小时
去实验
如何快速体验调用通义大模型
23
1.0小时
去实验
使用PAI+LLaMA Factory微调Qwen2-VL模型,搭建文旅领域知识问答机器人
582
1.0小时
去实验
SAE 极速部署专属 AI 证件照神器
21
1.0小时
去实验
如何快速体验知识检索增强应用
14
1.0小时
去实验
以电商场景为例搭建AI语义搜索应用
113
2.0小时
去实验