大模型
产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
查看 “
” 全部搜索结果
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
热门
百炼大模型
Modelscope模型即服务
弹性计算
通义灵码
云原生
数据库
云效DevOps
龙蜥操作系统
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
镜像站
开发者社区
>
ModelScope模型即服务
>
语音
语音
关注
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域
0
今日
321
内容
0
活动
298
关注
来自:
ModelScope模型即服务
最新
文章
视频
问答
推荐
游客vqlp5hynvkwyo
|
问答
pip install ttsfrd 报错
1270
1
0
已解决
游客2ex743phnxvvg
|
问答
最新的2月17版本中,怎样能验证支持MP3格式的音频转写,是否有MP3格式样例
511
1
0
游客lo7fk4eajkjgs
|
API
|
问答
使用modelscope线上16K VAD报错TypeError: 'NoneType' objec
911
1
0
游客elyfuttowlngg
|
问答
Sambert-Hifigan模型 如何使用实时流式合成
994
1
0
游客epyicmb4unyj2
|
问答
数据堂—150人中文客服平均音色合成库怎么下载
875
1
0
游客epyicmb4unyj2
|
语音技术
|
问答
Paraformer语音识别-中文-通用-16k-离线-large-pytorch有对应数据集吗
1027
0
0
GanymedeNil
|
问答
DFSMN语音降噪-单麦-48k-实时近场 什么时候可用?
798
1
0
653fzul3xijgw
|
并行计算
PyTorch
算法框架/工具
|
问答
这个模型的代码对CUDA的要求是什么?
701
1
0
游客obhgbobvl35g6
|
问答
Paraformer-large微调后得到的pth文件怎么转onnx
586
1
0
mit_vc_test_002
|
语音技术
|
问答
Paraformer语音识别-中文-通用-16k-离线-large-pytorch如何训练
1538
5
1
游客i3sw724hcte6q
|
问答
集成中的模型怎么clone啊
440
1
0
llw1309254902
|
异构计算
|
问答
尝试快速体验语音模型推理报GPU的错
569
2
0
1295855776038120
|
问答
FSMN远场唤醒-双麦-16k-你好米雅 运行需要py-sound-connect
811
2
0
大口吃饭饭啊
|
Docker
Windows
容器
|
问答
请问问这是我配置问题,还是推理本来就耗时久?
676
1
0
已解决
大口吃饭饭啊
|
问答
生成的 wav 文件比较大模型调用层面可以控制文件大小吗?
437
1
0
已解决
游客i5yk4ucwctt64
|
问答
请问模型怎么新建?
552
1
0
大口吃饭饭啊
|
自然语言处理
计算机视觉
|
问答
安装时报错提示from modelscope.outputs import OutputKeys不存
1062
2
0
已解决
大口吃饭饭啊
|
问答
您好,我可以在识别结果中获取每个单词的时间戳吗?
429
1
0
已解决
CCC啊
|
问答
报KeyError:应该怎么处理呢
507
1
0
已解决
CCC啊
|
问答
运营时提示报错
567
1
0
已解决
CCC啊
|
问答
切换版本后报错
454
1
0
已解决
CCC啊
|
问答
模型finetune过程中训练文本的英文如何处理?
438
1
0
已解决
CCC啊
|
问答
modelscope更新至1.2.1后模型报错
626
2
0
已解决
叫我饭啊啊
|
问答
你好,咨询下,这个模型能获取到子级别的时间戳信息吗?
516
1
0
已解决
叫我饭啊啊
|
问答
离线环境下如何加载模型
738
1
0
已解决
叫我饭啊啊
|
问答
请问可否在嵌入式设备上运行?
573
1
0
已解决
哈喽!小陈
|
问答
求助:模型使用较长wav引品显示报错
469
1
0
已解决
哈喽!小陈
|
问答
官方镜像测试报错怎么办?
562
1
0
已解决
哈喽!小陈
|
问答
为什么VAD采用新的方式后报错
623
1
0
已解决
我真不喜欢二次元
|
语音技术
|
问答
ModelScope中的语音降噪模型和语音合成模型可以支持导出ONNX了吗?
1450
4
1
lingchen88
|
并行计算
异构计算
|
问答
用inference_pipeline时无法指定gpu
580
1
0
游客za6lm3l5vsdzk
|
问答
请问下训练数据对frcrn网络的影响
657
16
0
1697799569231821
|
问答
Paraformer长音频版-识别过程中报错killed
1039
3
0
已解决
1879027174995671
|
问答
如何使用自己微调后的模型?
957
1
0
little_ant0
|
问答
使用Paraformer 最新版本,按照官方文档执行报错
826
1
0
1030541127660846
|
语音技术
|
问答
语音合成-中文-通用领域-16k模型无法运行
1143
2
0
游客35ii6aa7eq57e
|
问答
请问一下FRCRN官方模型的复现问题,是否是通过给出的流程能复现出官方提供的模型呢?
1343
4
0
za4dl4zt65h4u
|
问答
paraformer 16k将本地的wav音频上传后进行推理报错
784
1
0
游客vpclpbddmbwso
|
语音技术
|
问答
请问一下pipeline推理语音识别时候支持最大语音是多少kb的?
848
2
0
游客aitarrr6iefgy
|
问答
使用VAD的时候报错:NoValidRevisionError
1380
1
0
aliyun0626609716
|
问答
uniasr怎么选择用pipeline+GPU做推理?
1118
1
0
aliyun0626609716
|
异构计算
|
问答
用pipeline做推理的时候,怎么让其使用GPU?
1469
2
0
游客jfij4tsw2hn4m
|
语音技术
|
问答
UniASR如何进行流式语音识别?
1449
1
0
游客5fae5xsfsdubq
|
问答
调用中英混通用模型解码出现无法解码的情况
748
2
0
1295855776038120
|
问答
FSMN远场唤醒-双麦-16k-你好米雅 目前支持自定义数据训练么?后续会提供训练支持么?
874
1
0
已解决
1925010725393368
|
人工智能
语音技术
|
问答
语音合成速度太慢,且无法并行
1659
3
0
caoyj
|
语音技术
|
问答
asr并发识别情况下,识别结果会串了,即同一时间不同音频文件的识别结果完全相同
1542
2
0
游客yh6trrr7vogci
|
语音技术
|
问答
TTS 训练模型的文本标注中的 汉字之间#1,#3,#4 是什么意思呢?或者是采用什么标注工具吗?
1232
1
0
jkt4nncyd62dm
|
问答
FRCRN训练代码报错
957
1
0
jkt4nncyd62dm
|
问答
模型训练速度太慢
1828
4
1
1
...
2
3
4
5
6
跳转至:
你好!
登录掌握更多精彩内容
账号登录
我的内容
我的收藏
模型库
数据集
创空间
文档
更多版块
计算机视觉
自然语言处理
多模态
科学计算
活跃用户
1392707441177348
游客b322n534m4dfq
游客4v5hunqyjjxmg
相关产品
智能语音交互
文档详情
产品详情
我要发布
文章
问答