语音-问答-第5页-阿里云开发者社区-阿里云

文档备案控制台

开发者社区> ModelScope模型即服务> 语音

包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域

0

今日

326

内容

0

活动

310

关注

来自： ModelScope模型即服务

最新

文章

视频

问答

推荐

游客4makc2byb2zzu

|

语音技术

|

问答

Paraformer语音识别-中文-通用-16k-离线-large-热词版预训练模型怎么下载

891 1 0

tc_net

|

机器学习/深度学习语音技术

|

问答

Paraformer语音识别-中文-通用-16k-离线-large-pytorch 运行demo异常

1095 1 0

游客yklzpsasadxpm

|

问答

降噪模型导出onnx 时报错

759 1 0

游客vqlp5hynvkwyo

|

问答

pip install ttsfrd 报错

1498 1 0

已解决

游客2ex743phnxvvg

|

问答

最新的2月17版本中，怎样能验证支持MP3格式的音频转写，是否有MP3格式样例

627 1 0

游客lo7fk4eajkjgs

|

API

|

问答

使用modelscope线上16K VAD报错TypeError: 'NoneType' objec

1098 1 0

游客elyfuttowlngg

|

问答

Sambert-Hifigan模型如何使用实时流式合成

1150 1 0

游客epyicmb4unyj2

|

问答

数据堂—150人中文客服平均音色合成库怎么下载

1031 1 0

游客epyicmb4unyj2

|

语音技术

|

问答

Paraformer语音识别-中文-通用-16k-离线-large-pytorch有对应数据集吗

1178 0 0

GanymedeNil

|

问答

DFSMN语音降噪-单麦-48k-实时近场什么时候可用？

963 1 0

653fzul3xijgw

|

并行计算 PyTorch 算法框架/工具

|

问答

这个模型的代码对CUDA的要求是什么？

807 1 0

游客obhgbobvl35g6

|

问答

Paraformer-large微调后得到的pth文件怎么转onnx

724 1 0

mit_vc_test_002

|

语音技术

|

问答

Paraformer语音识别-中文-通用-16k-离线-large-pytorch如何训练

1845 5 1

游客i3sw724hcte6q

|

问答

集成中的模型怎么clone啊

557 1 0

llw1309254902

|

异构计算

|

问答

尝试快速体验语音模型推理报GPU的错

676 2 0

1295855776038120

|

问答

FSMN远场唤醒-双麦-16k-你好米雅运行需要py-sound-connect

953 2 0

大口吃饭饭啊

|

Docker Windows 容器

|

问答

请问问这是我配置问题，还是推理本来就耗时久？

772 1 0

已解决

大口吃饭饭啊

|

问答

生成的 wav 文件比较大模型调用层面可以控制文件大小吗？

549 1 0

已解决

游客i5yk4ucwctt64

|

问答

请问模型怎么新建？

647 1 0

大口吃饭饭啊

|

自然语言处理计算机视觉

|

问答

安装时报错提示from modelscope.outputs import OutputKeys不存

1203 2 0

已解决

大口吃饭饭啊

|

问答

您好，我可以在识别结果中获取每个单词的时间戳吗？

600 1 0

已解决

CCC啊

|

问答

报KeyError:应该怎么处理呢

623 1 0

已解决

CCC啊

|

问答

运营时提示报错

674 1 0

已解决

CCC啊

|

问答

切换版本后报错

574 1 0

已解决

CCC啊

|

问答

模型finetune过程中训练文本的英文如何处理？

550 1 0

已解决

CCC啊

|

问答

modelscope更新至1.2.1后模型报错

830 2 0

已解决

叫我饭啊啊

|

问答

你好，咨询下，这个模型能获取到子级别的时间戳信息吗？

608 1 0

已解决

叫我饭啊啊

|

问答

离线环境下如何加载模型

882 1 0

已解决

叫我饭啊啊

|

问答

请问可否在嵌入式设备上运行？

660 1 0

已解决

哈喽！小陈

|

问答

求助：模型使用较长wav引品显示报错

565 1 0

已解决

哈喽！小陈

|

问答

官方镜像测试报错怎么办？

691 1 0

已解决

哈喽！小陈

|

问答

为什么VAD采用新的方式后报错

752 1 0

已解决

我真不喜欢二次元

|

语音技术

|

问答

ModelScope中的语音降噪模型和语音合成模型可以支持导出ONNX了吗？

1679 4 1

lingchen88

|

并行计算异构计算

|

问答

用inference_pipeline时无法指定gpu

707 1 0

游客za6lm3l5vsdzk

|

问答

请问下训练数据对frcrn网络的影响

897 16 0

1697799569231821

|

问答

Paraformer长音频版-识别过程中报错killed

1204 3 0

已解决

1879027174995671

|

问答

如何使用自己微调后的模型？

1084 1 0

little_ant0

|

问答

使用Paraformer 最新版本，按照官方文档执行报错

955 1 0

1030541127660846

|

语音技术

|

问答

语音合成-中文-通用领域-16k模型无法运行

1280 2 0

游客35ii6aa7eq57e

|

问答

请问一下FRCRN官方模型的复现问题，是否是通过给出的流程能复现出官方提供的模型呢？

1505 4 0

za4dl4zt65h4u

|

问答

paraformer 16k将本地的wav音频上传后进行推理报错

892 1 0

游客vpclpbddmbwso

|

语音技术

|

问答

请问一下pipeline推理语音识别时候支持最大语音是多少kb的？

1040 2 0

游客aitarrr6iefgy

|

问答

使用VAD的时候报错：NoValidRevisionError

1550 1 0

aliyun0626609716

|

问答

uniasr怎么选择用pipeline+GPU做推理？

1254 1 0

aliyun0626609716

|

异构计算

|

问答

用pipeline做推理的时候，怎么让其使用GPU？

1616 2 0

游客jfij4tsw2hn4m

|

语音技术

|

问答

UniASR如何进行流式语音识别？

1728 1 0

游客5fae5xsfsdubq

|

问答

调用中英混通用模型解码出现无法解码的情况

877 2 0

1295855776038120

|

问答

FSMN远场唤醒-双麦-16k-你好米雅目前支持自定义数据训练么？后续会提供训练支持么？

1058 1 0

已解决

1925010725393368

|

人工智能语音技术

|

问答

语音合成速度太慢，且无法并行

1880 3 0

caoyj

|

语音技术

|

问答

asr并发识别情况下，识别结果会串了，即同一时间不同音频文件的识别结果完全相同

1714 2 0

1

...

2

3

4

5

6

你好！

登录掌握更多精彩内容

账号登录

更多版块

计算机视觉自然语言处理多模态科学计算

活跃用户

游客kvn4asfs3s66m

相关产品

智能语音交互

文档详情产品详情

我要发布

文章问答