大模型
产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
查看 “
” 全部搜索结果
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
热门
百炼大模型
Modelscope模型即服务
弹性计算
通义灵码
云原生
数据库
云效DevOps
龙蜥操作系统
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
镜像站
开发者社区
ModelScope模型即服务
语音
正文
这个模型的代码对CUDA的要求是什么?
另外pytorch的版本是哪个?
展开
收起
Paraformer语音识别-中文-通用-16k-离线-large-pytorch
653fzul3xijgw
2023-03-01 10:58:55
701
分享
版权
1
条回答
写回答
取消
提交回答
通义小二
您好,麻烦您留下对应的模型信息哈~ 感谢~
2023-03-02 17:51:42
赞同
展开评论
相关问答
语音
this xml file does not appear to have any style in
47360
10
0
请问下 我访问接口不通 什么原因 Provisional headers are shown
1539
0
0
OSS的endpoint如何查看
36075
6
0
购买阿里国外的云服务器是否可以访问谷歌?
80181
47
0
配置了安全组规则,端口还是无法访问
32122
25
0
通过www和不带www的网址输入最终都指向www.我的域名.com,求指教
122987
28
0
sql server的用户名和密码怎么查啊?
35336
21
0
域名在腾讯云备案成功,解析到阿里云服务器,提示仍需备案?
59368
30
0
Connection reset by peer的常见原因及解决办法
3648
1
0
设置域名解析如何指向我的服务器url包括端口号
17469
2
0
ModelScope模型即服务
语音
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域
我要提问
相关文章
使用雅可比椭圆函数为Reissner平面有限应变梁提供封闭形式解(Matlab代码实现)
语音克隆 Index-TTS 详细介绍
Step-Audio2 声音克隆 详细介绍
【无人机三维路径规划】基于遗传算法GA结合粒子群算法PSO无人机复杂环境避障三维路径规划(含GA和PSO对比)研究(Matlab代码代码实现)
用于Metamaterial Cooke Triplet的有限差分时间域模拟研究(Matlab代码实现)
热门讨论
热门文章
关于 Windows平台上 ttsfrd 库的问题。
目录空间都删的只剩2G了,还报OSError: [Errno 122] Disk quota exc
modelscope上跑报错,提示要pip install ttsfrd,搞不定
wekws训练自定义数据集的误唤醒较高。
KeyError: 'asr-inference is not in the pipelines r
ttsfrd 是不开源的吗
Paraformer语音识别-中文-通用-16k-离线-large-长音频版,无网络时无法使用如何处
目前有没有什么对于识别英语、俄语、韩语有较高准确率的语音模型
提示缺少 MindAec
关于 modelscope-funasr 报错的问题。
展开全部
Dolphin:40语种+22方言!清华联合海天瑞声推出的语音识别大模型,识别精度超Whisper两代
FireRedASR:精准识别普通话、方言和歌曲歌词!小红书开源工业级自动语音识别模型
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
CosyVoice 2.0:阿里开源升级版语音生成大模型,支持多语言和跨语言语音合成,提升发音和音色等的准确性
三行代码实现实时语音转文本,支持自动断句和语音唤醒,用 RealtimeSTT 轻松创建高效语音 AI 助手
SpeechGPT 2.0:复旦大学开源端到端 AI 实时语音交互模型,实现 200ms 以内延迟的实时交互
WhisperChain:开源 AI 实时语音转文字工具!自动消噪优化文本,效率翻倍
PaddleSpeech:百度飞桨开源语音处理神器,识别合成翻译全搞定
Step-Audio:开源语音交互新标杆!这个国产AI能说方言会rap,1个模型搞定ASR+TTS+角色扮演
Kokoro-TTS:超轻量级文本转语音模型,支持生成多种语言和多种语音风格
展开全部
还有其他疑问?
咨询AI助理