大模型
产品
解决方案
权益
定价
云市场
伙伴
服务
了解阿里云
查看 “
” 全部搜索结果
AI 助理
文档
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
热门
百炼大模型
Modelscope模型即服务
弹性计算
通义灵码
云原生
数据库
云效DevOps
龙蜥操作系统
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
镜像站
开发者社区
ModelScope模型即服务
语音
正文
请问模型怎么新建?
请问模型怎么新建?
展开
收起
CTC语音唤醒-移动端-单麦-16k-小云小云
游客i5yk4ucwctt64
2023-02-24 10:20:23
574
分享
版权
1
条回答
写回答
取消
提交回答
通义小二
您好,您点击以下链接,看下以下内容是否能回答您问题哈~
模型的创建与文件上传
2023-03-02 18:05:57
赞同
展开评论
相关问答
语音
购买阿里国外的云服务器是否可以访问谷歌?
84787
47
0
请问下 我访问接口不通 什么原因 Provisional headers are shown
4257
2
0
【阿里云运维部署工具AppDeploy详细教程】之4:应用部署
39282
6
0
重启Docker后报错:Error response from daemon
2696
0
0
阿里云服务器续费后一直处于启动中状态,服务器打不开了 怎么解决???
35918
6
0
域名在腾讯云备案成功,解析到阿里云服务器,提示仍需备案?
61344
32
0
this xml file does not appear to have any style in
52442
10
0
如何加速中国访问美国云的服务器访问速度
31476
8
0
OSS的endpoint如何查看
37773
6
0
sql server的用户名和密码怎么查啊?
37960
21
0
ModelScope模型即服务
语音
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域
我要提问
相关文章
【语音识别】基于K近邻分类算法的语音情感识别(Matlab代码实现)
面向能效和低延迟的语音控制智能家居:离线语音识别与物联网集成方案——论文阅读
基于MFCC(梅尔频率倒谱系数)和GMM(高斯混合模型)的语音识别
小结
构建智能客服:阿里云智能语音交互+函数计算的低成本方案
热门讨论
热门文章
有无语音分类的相关开源预训练模型推荐?主要是识别:御姐音、萝莉音、烟嗓、少年感 此类类似的
modelscope上跑报错,提示要pip install ttsfrd,搞不定
关于 Windows平台上 ttsfrd 库的问题。
wekws训练自定义数据集的误唤醒较高。
目录空间都删的只剩2G了,还报OSError: [Errno 122] Disk quota exc
关于 modelscope-funasr 报错的问题。
自动标注模型ttsfrd初始化失败
KeyError: 'asr-inference is not in the pipelines r
魔搭modelscope按官方文档安装音频环境失败
直接开源!下一代“杀手锏”语音识别模型
展开全部
CosyVoice 2.0:阿里开源升级版语音生成大模型,支持多语言和跨语言语音合成,提升发音和音色等的准确性
Clone-voice:开源的声音克隆工具,支持文本转语音或改变声音风格,支持16种语言
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
SpeechGPT 2.0:复旦大学开源端到端 AI 实时语音交互模型,实现 200ms 以内延迟的实时交互
Dolphin:40语种+22方言!清华联合海天瑞声推出的语音识别大模型,识别精度超Whisper两代
FireRedASR:精准识别普通话、方言和歌曲歌词!小红书开源工业级自动语音识别模型
百聆:集成Deepseek API及语音技术的开源AI语音对话助手,实时交互延迟低至800ms
WhisperChain:开源 AI 实时语音转文字工具!自动消噪优化文本,效率翻倍
Text to Bark:让狗狗听懂人话!全球首个AI"狗语"生成器,137种狗狗口音任君挑选
ClearerVoice-Studio:阿里通义开源的语音处理框架,提供语音增强、分离和说话人提取等功能
展开全部
还有其他疑问?
咨询AI助理