大模型
产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
百炼大模型
Modelscope模型即服务
弹性计算
云原生
数据库
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
物联网
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
开发者社区
>
ModelScope模型即服务
>
语音
>
正文
这个模型的代码对CUDA的要求是什么?
另外pytorch的版本是哪个?
展开
收起
Paraformer语音识别-中文-通用-16k-离线-large-pytorch
653fzul3xijgw
2023-03-01 10:58:55
681
0
1
条回答
写回答
取消
提交回答
通义小二
您好,麻烦您留下对应的模型信息哈~ 感谢~
2023-03-02 17:51:42
赞同
展开评论
打赏
相关问答
语音
this xml file does not appear to have any style in
36664
9
0
支付宝H5 下载的时候,提示 【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】
237178
10
0
互联网信息服务增值电信业务经营许可证申请资料
6698
2
0
有哪些值得收藏的五个种子搜索引擎&磁力搜索引擎?
97161
16
0
OSS的endpoint如何查看
30863
3
0
如果购买了域名,一定要备案才能用吗
38876
36
0
com/action/joingroup?code=v1是什么意思
209129
20
0
什么是红帽认证?
3283
1
0
java的官网网址是什么
32851
23
0
域名申请
5123
3
0
ModelScope模型即服务
语音
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域
我要提问
热门讨论
热门文章
关于 Windows平台上 ttsfrd 库的问题。
2262
modelscope上跑报错,提示要pip install ttsfrd,搞不定
8473
No module named 'ttsfrd'
1573
KeyError: 'asr-inference is not in the pipelines r
2257
报了很多警告,请问怎么解决?
1081
个性化语音合成训练 [ONNXRuntimeError]:7:INVALID_PROTOBUF
1181
ttsfrd 是不开源的吗
4019
目录空间都删的只剩2G了,还报OSError: [Errno 122] Disk quota exc
1143
以下代码怎么调整语句之间的停顿?原模型没有停顿感,使用过ssml标注添加 break没有任何效果
431
在Windows平台上关于 ModelScorpe Audio 安装涉及 kwsbp 的问题
766
展开全部
CosyVoice 2.0:阿里开源升级版语音生成大模型,支持多语言和跨语言语音合成,提升发音和音色等的准确性
2192
百聆:集成Deepseek API及语音技术的开源AI语音对话助手,实时交互延迟低至800ms
676
FireRedASR:精准识别普通话、方言和歌曲歌词!小红书开源工业级自动语音识别模型
154
Zonos:油管博主集体转粉!开源TTS神器Zonos爆火:克隆你的声音说5国语言,还能调喜怒哀乐
76
SpeechGPT 2.0:复旦大学开源端到端 AI 实时语音交互模型,实现 200ms 以内延迟的实时交互
211
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
454
Kokoro-TTS:超轻量级文本转语音模型,支持生成多种语言和多种语音风格
265
TIGER:清华突破性模型让AI「听觉」进化:参数量暴降94%,菜市场都能分离清晰人声
55
ClearerVoice-Studio:阿里通义开源的语音处理框架,提供语音增强、分离和说话人提取等功能
543
Hibiki:实时语音翻译模型打破语言交流障碍!支持将语音实时翻译成其他语言的语音或文本
108
展开全部
相关文章
Python入门:1.Python介绍
X-R1:3090也能训7B模型!开源框架X-R1把训练成本打下来了:10美元训出企业级LLM
Unsloth:学生党福音!开源神器让大模型训练提速10倍:单GPU跑Llama3,5小时变30分钟
Step-Video-T2V:碾压Sora?国产开源巨兽Step-Video-T2V杀到:300亿参数一键生成204帧视频
用户实操:如何以龙蜥操作系统为底座在 CPU 上运行 DeepSeek-R1
相关电子书
更多
低代码开发师(初级)实战教程
立即下载
冬季实战营第三期:MySQL数据库进阶实战
立即下载
阿里巴巴DevOps 最佳实践手册
立即下载