大模型
产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
HOT
查看 “
” 全部搜索结果
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
热门
百炼大模型
Modelscope模型即服务
弹性计算
通义灵码
云原生
数据库
云效DevOps
龙蜥操作系统
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
镜像站
开发者社区
ModelScope模型即服务
语音
正文
语音合成,本地部署。安装环境时,kantts包未找到合适版本
语音合成,本地部署。安装环境时,kantts包未找到合适版本
展开
收起
语音合成-中文-多情感领域-16k-多发音人
1562738900828747
2023-08-09 10:22:14
488
分享
版权
1
条回答
写回答
取消
提交回答
vebrun
您应该把报错贴出来
2023-08-16 09:51:50
赞同
展开评论
相关问答
阿里云语音AI语音合成 语音识别私有化部署如何操作?
136
0
0
阿里语音AI语音合成的私有化部署机器配置要求怎么办?
74
0
0
函数计算语音合成的python sdk 根本无法部署到 函数计算单元?
74
0
0
modelscope-funasr想部署一下语音合成,按照官网文档,获取下来,安装执行报错。怎么办?
94
0
0
modelscope-funasr语音合成-中文-多情感领域这个语音合成有没有部署介绍呀?
91
0
0
ModelScope中求教一下,怎么把部署在服务器上的接口拉下来部署在本地比如语音合成?
304
1
0
目前使用SambertHifigan个性化语音合成-中文-预训练 可以训练中文,有英文的预训练版本?
519
1
0
我买的阿里语音AI合成包,合成的语音可以拿来训练语音合成模型吗?
357
4
0
阿里语音AI语音合成私有化部署我记得看过,可以发下文档吗?
163
2
0
智能语音交互、语音AI中阿里这边支持维语吗? 支持本地化部署吗?语音识别+ 语音合成
229
1
0
ModelScope模型即服务
语音
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域
我要提问
相关文章
从音频与照片生成数字人视频:阿里云百炼工作流打造“超级数字人”全流程解析
前沿速览:TrafficVLM、DeepSeek-Terminus、Qwen3-Omni、蚂蚁百灵、Wan2.2-Animate、Qianfan-VL
【车载Android】模拟Android系统的高负载环境
你们催更的模型,云栖大会一口气全发了!
阿里云百炼大模型收费价格:调用、调优和部署费用清单
热门讨论
热门文章
语音唤醒可以自定义唤醒词嘛?比如“小云,小云”换成自己的命令词?如何训练模型
关于 Windows平台上 ttsfrd 库的问题。
目录空间都删的只剩2G了,还报OSError: [Errno 122] Disk quota exc
modelscope上跑报错,提示要pip install ttsfrd,搞不定
KeyError: 'asr-inference is not in the pipelines r
用python实现语音端点检测(Voice Activity Detection,VAD)
linux系统运行TTS语音合成报错 Could not initialize NNPACK
关于 modelscope-funasr 报错的问题。
您好,我想请问一下FRCRN是如何保证因果的呢?
pip安装语音领域模型依赖报错。
展开全部
Dolphin:40语种+22方言!清华联合海天瑞声推出的语音识别大模型,识别精度超Whisper两代
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
FireRedASR:精准识别普通话、方言和歌曲歌词!小红书开源工业级自动语音识别模型
百聆:集成Deepseek API及语音技术的开源AI语音对话助手,实时交互延迟低至800ms
TIGER:清华突破性模型让AI「听觉」进化:参数量暴降94%,菜市场都能分离清晰人声
CosyVoice 2.0:阿里开源升级版语音生成大模型,支持多语言和跨语言语音合成,提升发音和音色等的准确性
三行代码实现实时语音转文本,支持自动断句和语音唤醒,用 RealtimeSTT 轻松创建高效语音 AI 助手
SpeechGPT 2.0:复旦大学开源端到端 AI 实时语音交互模型,实现 200ms 以内延迟的实时交互
Clone-voice:开源的声音克隆工具,支持文本转语音或改变声音风格,支持16种语言
Step-Audio:开源语音交互新标杆!这个国产AI能说方言会rap,1个模型搞定ASR+TTS+角色扮演
展开全部
还有其他疑问?
咨询AI助理