语音-最新-第4页-阿里云开发者社区-阿里云

备案控制台

开发者社区> ModelScope模型即服务> 语音

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

0

今日

283

内容

0

活动

273

关注

来自： ModelScope模型即服务

最新

文章

视频

问答

推荐

1813308765944147

|

搜索推荐 API 语音技术

|

问答

个性化语音合成预训练的时候提示模型找不到，怎么处理？

993 1 0

游客ih67vlbon4p4g

|

问答

训练声音模型后无法生成音频啊？

612 1 0

1593316062336815

|

语音技术内存技术

|

问答

PTTS-basemodel微调报错

720 3 0

1622007339875640

|

机器学习/深度学习语音技术

|

问答

Paraformer语音识别-中文-通用-16k-离线-large-长音频版微调失败

597 1 0

游客tqsxlcu6ie37g

|

机器学习/深度学习语音技术

|

问答

文献阅读：X-VECTOR--用于说话人识别的鲁棒深度神经网络嵌入

621 0 0

游客tqsxlcu6ie37g

|

Ubuntu 前端开发大数据

|

问答

语言处理之 xvector

544 0 0

游客tqsxlcu6ie37g

|

Web App开发机器学习/深度学习人工智能

|

问答

使用魔搭开发自己的语音AI：从入门到精通

1008 0 0

游客tqsxlcu6ie37g

|

人工智能达摩院自然语言处理

|

问答

直接开源！下一代“杀手锏”语音识别模型

851 0 0

游客tqsxlcu6ie37g

|

人工智能达摩院 Ubuntu

|

问答

语音识别系列︱利用达摩院ModelScope进行语音识别+标点修复

945 0 0

游客tqsxlcu6ie37g

|

机器学习/深度学习自然语言处理语音技术

|

问答

语音识别端到端模型解读：FSMN及其变体模型

521 0 0

游客tqsxlcu6ie37g

|

Python

|

问答

用python实现语音端点检测(Voice Activity Detection,VAD)

1054 0 0

游客tqsxlcu6ie37g

|

机器学习/深度学习自然语言处理数据可视化

|

问答

Pytorch动手实现Transformer机器翻译

678 0 0

游客tqsxlcu6ie37g

|

机器学习/深度学习自然语言处理并行计算

|

问答

【实战教程】用Pytorch实现Transformer

668 0 0

游客tqsxlcu6ie37g

|

机器学习/深度学习 JSON 自然语言处理

|

问答

PyTorch Transformer 英中翻译超详细教程

876 0 0

游客tqsxlcu6ie37g

|

机器学习/深度学习语音技术

|

问答

语音论文阅读(基于Transformer的在线CTC/Attention 端到端语音识别架构)

480 0 0

游客tqsxlcu6ie37g

|

人工智能自然语言处理算法

|

问答

【技术揭秘】可控时延语音识别文本后处理技术

621 0 0

游客tqsxlcu6ie37g

|

机器学习/深度学习人工智能达摩院

|

问答

七大模型最新开源，推理速度升级，几行代码可实现微调

750 0 0

aliyun0626609716

|

Linux 语音技术

|

问答

运行官网示例报错！！

447 1 0

游客tkemac5mkcre2

|

问答

可以支持多人的音频同时FineTune训练吗？

304 1 0

1100032359478697

|

问答

安装ttsfrd库提示找不到版本

933 1 0

1954989609106772

|

语音技术

|

问答

Paraformer语音识别模型，没有提供基本的断句能力是吧？

726 1 0

jkt4nncyd62dm

|

问答

48kFRCRN模型

459 1 0

游客yavauo4zjdmem

|

搜索推荐语音技术

|

问答

请问该四川方言模型是从头开始训练的吗？能否直接在个性化语音合成模型上进行微调？

637 1 0

游客yavauo4zjdmem

|

问答

在使用text_to_wav.py进行推理时，使用--lang Sichuan 参数出现以下错误：

345 1 0

游客22fwimmggr6m6

|

问答

这个预训练模型的训练集包括aishell这几个数据集吗？

216 0 0

游客q3mxrnifhp7ie

|

语音技术

|

问答

modelScope语音合成是不是不能本地使用

531 1 0

GanymedeNil

|

问答

KAN-TTS 在 conda 环境下无法安装 ttsfrd

758 1 0

GanymedeNil

|

博文

KAN-TTS 在 conda 环境下无法安装 ttsfrd

KAN-TTS 基于conda安装环境的时候无法安装ttsfrd，但在退出conda后，在系统中可以安装

1142 0 2

游客lgbin5hhv43km

|

编解码

|

问答

ONNXRuntime inferece failed.

572 1 0

储部长

|

问答

模型训练完后，拿到model_id了，后面怎么直接调用这个model_id去合成语音？

253 1 0

储部长

|

问答

根据文字合成语音，有时候一个句子没录完就突然结束了，这是为什么?

274 1 0

通义小二

|

机器学习/深度学习数据采集人工智能

|

问答

零门槛玩转AI声音定制，3分钟即可复刻你的发音模型

2432 1 0

MrChen007

|

测试技术开发者异构计算

|

问答

社区里面有很多模型，每个模型所需要的部署资源，比如占用的GPU显存，推理速度等有参考数据吗？

546 1 0

hwang824

|

搜索推荐语音技术

|

问答

在NoteBook中训练个性化语音合成模型报错

1257 4 0

游客q7hbi7suwf2ek

|

问答

modelscope中8k的vad yaml文件中的speech_noise_thresh参数不生效

549 2 0

游客jii4kod53yixw

|

搜索推荐语音技术

|

问答

No such file or directory: wav_pre/temp.wav'

769 2 1

游客mpu7l7wur24lw

|

问答

按官网的例子在Notebook上运行的，trainer.train() 报了这个错

668 3 0

游客fnfy53hoevbio

|

问答

请问这一块的扩充epoch是在哪部分代码里

373 1 0

游客fnfy53hoevbio

|

问答

请问这一块扩充epoch是在哪个文档

428 1 0

aliyun0626609716

|

语音技术

|

问答

运行语音合成模型的官网代码示例报错

617 2 0

1872435243206641

|

问答

流程里少了一步，把config.yaml里的speaker_list:后面改成数据集的speaker

557 1 0

游客obhgbobvl35g6

|

问答

关于uniasr闽南语模型字典的问题

439 1 0

hwang824

|

问答

在预处理步骤，出现报错ValueError: expect 29 but scp only have

497 1 0

游客xs36fpzxzdece

|

Ubuntu PyTorch 语音技术

|

问答

AssertionError / TypeError 两处报错疑问

779 1 0

游客xs36fpzxzdece

|

开发工具 git

|

问答

报RuntimeError的bug的修复过程

734 1 0

小小新新

|

Web App开发语音技术

|

问答

语音识别模型CPU runtime量化方案中VAD的实现问题

631 1 0

小小新新

|

C++

|

问答

关于VAD转成onnx模型后C++实时推理

595 1 0

lovemefan

|

语音技术

|

问答

UniASR语音识别-缅甸语-通用-16k中的词表不对

707 2 0

游客t4tg35hdlcxnw

|

PyTorch 语音技术算法框架/工具

|

问答

Conformer语音识别-中文-aishell1-16k-离线-pytorch模型微调报错

534 1 0

游客4makc2byb2zzu

|

语音技术

|

问答

Paraformer语音识别-中文-通用-16k-离线-large-热词版预训练模型怎么下载

634 1 0

1

...

2

3

4

5

6

你好！

登录掌握更多精彩内容

账号登录

更多版块

计算机视觉自然语言处理多模态科学计算

活跃用户

游客mdx7ljevxvcs2

游客qq3glrvmeyzui

慕容逍遥123

游客wohs4qyfi4xeg

1432226210479870

相关产品

智能语音交互

文档详情产品详情

我要发布

文章问答