产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
百炼大模型
Modelscope模型即服务
弹性计算
云原生
数据库
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
物联网
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
开发者社区
>
ModelScope模型即服务
>
语音
语音
关注
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域
0
今日
283
内容
0
活动
273
关注
来自:
ModelScope模型即服务
最新
文章
视频
问答
推荐
1813308765944147
|
搜索推荐
API
语音技术
|
问答
个性化语音合成预训练的时候提示模型找不到,怎么处理?
993
1
0
游客ih67vlbon4p4g
|
问答
训练声音模型后 无法生成音频啊?
612
1
0
1593316062336815
|
语音技术
内存技术
|
问答
PTTS-basemodel微调报错
720
3
0
1622007339875640
|
机器学习/深度学习
语音技术
|
问答
Paraformer语音识别-中文-通用-16k-离线-large-长音频版微调失败
597
1
0
游客tqsxlcu6ie37g
|
机器学习/深度学习
语音技术
|
问答
文献阅读:X-VECTOR--用于说话人识别的鲁棒深度神经网络嵌入
621
0
0
游客tqsxlcu6ie37g
|
Ubuntu
前端开发
大数据
|
问答
语言处理 之 xvector
544
0
0
游客tqsxlcu6ie37g
|
Web App开发
机器学习/深度学习
人工智能
|
问答
使用魔搭开发自己的语音AI:从入门到精通
1008
0
0
游客tqsxlcu6ie37g
|
人工智能
达摩院
自然语言处理
|
问答
直接开源!下一代“杀手锏”语音识别模型
851
0
0
游客tqsxlcu6ie37g
|
人工智能
达摩院
Ubuntu
|
问答
语音识别系列︱利用达摩院ModelScope进行语音识别+标点修复
945
0
0
游客tqsxlcu6ie37g
|
机器学习/深度学习
自然语言处理
语音技术
|
问答
语音识别端到端模型解读:FSMN及其变体模型
521
0
0
游客tqsxlcu6ie37g
|
Python
|
问答
用python实现语音端点检测(Voice Activity Detection,VAD)
1054
0
0
游客tqsxlcu6ie37g
|
机器学习/深度学习
自然语言处理
数据可视化
|
问答
Pytorch动手实现Transformer机器翻译
678
0
0
游客tqsxlcu6ie37g
|
机器学习/深度学习
自然语言处理
并行计算
|
问答
【实战教程】用Pytorch实现Transformer
668
0
0
游客tqsxlcu6ie37g
|
机器学习/深度学习
JSON
自然语言处理
|
问答
PyTorch Transformer 英中翻译超详细教程
876
0
0
游客tqsxlcu6ie37g
|
机器学习/深度学习
语音技术
|
问答
语音论文阅读(基于Transformer的在线CTC/Attention 端到端语音识别架构)
480
0
0
游客tqsxlcu6ie37g
|
人工智能
自然语言处理
算法
|
问答
【技术揭秘】可控时延语音识别文本后处理技术
621
0
0
游客tqsxlcu6ie37g
|
机器学习/深度学习
人工智能
达摩院
|
问答
七大模型最新开源,推理速度升级,几行代码可实现微调
750
0
0
aliyun0626609716
|
Linux
语音技术
|
问答
运行官网示例报错!!
447
1
0
游客tkemac5mkcre2
|
问答
可以支持多人的音频同时FineTune训练吗?
304
1
0
1100032359478697
|
问答
安装ttsfrd库提示找不到版本
933
1
0
1954989609106772
|
语音技术
|
问答
Paraformer语音识别模型,没有提供基本的断句能力是吧?
726
1
0
jkt4nncyd62dm
|
问答
48kFRCRN模型
459
1
0
游客yavauo4zjdmem
|
搜索推荐
语音技术
|
问答
请问该四川方言模型是从头开始训练的吗?能否直接在个性化语音合成模型上进行微调?
637
1
0
游客yavauo4zjdmem
|
问答
在使用text_to_wav.py进行推理时,使用--lang Sichuan 参数出现以下错误:
345
1
0
游客22fwimmggr6m6
|
问答
这个预训练模型的训练集包括aishell这几个数据集吗?
216
0
0
游客q3mxrnifhp7ie
|
语音技术
|
问答
modelScope语音合成是不是不能本地使用
531
1
0
GanymedeNil
|
问答
KAN-TTS 在 conda 环境下无法安装 ttsfrd
758
1
0
GanymedeNil
|
博文
KAN-TTS 在 conda 环境下无法安装 ttsfrd
KAN-TTS 基于conda安装环境的时候无法安装ttsfrd,但在退出conda后,在系统中可以安装
1142
0
2
游客lgbin5hhv43km
|
编解码
|
问答
ONNXRuntime inferece failed.
572
1
0
储部长
|
问答
模型训练完后,拿到model_id了,后面怎么直接调用这个model_id去合成语音?
253
1
0
储部长
|
问答
根据文字合成语音,有时候一个句子没录完就突然结束了,这是为什么?
274
1
0
通义小二
|
机器学习/深度学习
数据采集
人工智能
|
问答
零门槛玩转AI声音定制,3分钟即可复刻你的发音模型
2432
1
0
MrChen007
|
测试技术
开发者
异构计算
|
问答
社区里面有很多模型,每个模型所需要的部署资源,比如占用的GPU显存,推理速度等有参考数据吗?
546
1
0
hwang824
|
搜索推荐
语音技术
|
问答
在NoteBook中训练个性化语音合成模型报错
1257
4
0
游客q7hbi7suwf2ek
|
问答
modelscope中8k的vad yaml文件中的speech_noise_thresh参数不生效
549
2
0
游客jii4kod53yixw
|
搜索推荐
语音技术
|
问答
No such file or directory: wav_pre/temp.wav'
769
2
1
游客mpu7l7wur24lw
|
问答
按官网的例子在Notebook上运行的,trainer.train() 报了这个错
668
3
0
游客fnfy53hoevbio
|
问答
请问这一块的扩充epoch是在哪部分代码里
373
1
0
游客fnfy53hoevbio
|
问答
请问这一块扩充epoch是在哪个文档
428
1
0
aliyun0626609716
|
语音技术
|
问答
运行语音合成模型的官网代码示例报错
617
2
0
1872435243206641
|
问答
流程里少了一步,把config.yaml里的speaker_list:后面改成数据集的speaker
557
1
0
游客obhgbobvl35g6
|
问答
关于uniasr闽南语模型字典的问题
439
1
0
hwang824
|
问答
在预处理步骤,出现报错ValueError: expect 29 but scp only have
497
1
0
游客xs36fpzxzdece
|
Ubuntu
PyTorch
语音技术
|
问答
AssertionError / TypeError 两处报错疑问
779
1
0
游客xs36fpzxzdece
|
开发工具
git
|
问答
报RuntimeError的bug的修复过程
734
1
0
小小新新
|
Web App开发
语音技术
|
问答
语音识别模型CPU runtime量化方案中VAD的实现问题
631
1
0
小小新新
|
C++
|
问答
关于VAD转成onnx模型后C++实时推理
595
1
0
lovemefan
|
语音技术
|
问答
UniASR语音识别-缅甸语-通用-16k中的词表不对
707
2
0
游客t4tg35hdlcxnw
|
PyTorch
语音技术
算法框架/工具
|
问答
Conformer语音识别-中文-aishell1-16k-离线-pytorch模型微调报错
534
1
0
游客4makc2byb2zzu
|
语音技术
|
问答
Paraformer语音识别-中文-通用-16k-离线-large-热词版预训练模型怎么下载
634
1
0
1
...
2
3
4
5
6
跳转至:
你好!
登录掌握更多精彩内容
账号登录
我的内容
我的收藏
模型库
数据集
创空间
文档
更多版块
计算机视觉
自然语言处理
多模态
科学计算
活跃用户
游客mdx7ljevxvcs2
游客qq3glrvmeyzui
慕容逍遥123
游客wohs4qyfi4xeg
1432226210479870
相关产品
智能语音交互
文档详情
产品详情
我要发布
文章
问答