产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
百炼大模型
Modelscope模型即服务
弹性计算
云原生
数据库
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
物联网
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
开发者社区
>
ModelScope模型即服务
>
语音
>
视频
>
正文
如何当好人类的第三只眼?看见语音,快速准确又省钱
发布者:
Dev-Talk
2023-02-07 18:03:06
50555
Dev-Talk
+关注
视频介绍
如何当好人类的第三只眼?看见语音,快速准确又省钱
相关视频
193分18秒
阿里云数智创新城市行——智能运维专场
Dev-Talk
7105播放
229分34秒
智能开发与高效运维
Dev-Talk
532播放
43分59秒
数据库大讲堂—阿里集团数据库运维实践
Dev-Talk
1762播放
35分15秒
【阿里云运维能力成长系列课】年底系统保养,这些事你得知道
Dev-Talk
1098播放
53分19秒
【阿里云运维能力成长系列课】保障系统稳定性,高效应对双11
Dev-Talk
1248播放
75分15秒
容器化应用痛点剖析:问题诊断、监控及运维
开发者说
2055播放
6分16秒
运维知识体系修炼心法 | 对话运维老班长赵舜东
开发者说
1149播放
30分58秒
安全说道第二期 |云上安全运维三板斧
开发者说
1423播放
6分34秒
【云吞铺子】CDN运维及管理
阿里云支持与服务
7995播放
40分58秒
中小型企业运维之路
社区助手
3789播放
ModelScope模型即服务
语音
+关注
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域
热门文章
热门讨论
CosyVoice 2.0:阿里开源升级版语音生成大模型,支持多语言和跨语言语音合成,提升发音和音色等的准确性
425
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
112
Clone-voice:开源的声音克隆工具,支持文本转语音或改变声音风格,支持16种语言
118
KAN-TTS 在 conda 环境下无法安装 ttsfrd
1301
TangoFlux:高速生成高质量音频,仅用3.7秒生成长达30秒的音频,支持文本到音频转换
22
ClearerVoice-Studio:阿里通义开源的语音处理框架,提供语音增强、分离和说话人提取等功能
173
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
110
ChatTTSPlus:开源文本转语音工具,支持语音克隆,是 ChatTTS 的扩展版本
75
智能降噪
1125
Fish Speech 1.5:Fish Audio 推出的零样本语音合成模型,支持13种语言
106
展开全部
modelscope上跑报错,提示要pip install ttsfrd,搞不定
7995
关于 Windows平台上 ttsfrd 库的问题。
1871
KeyError: 'asr-inference is not in the pipelines r
2093
自动标注模型ttsfrd初始化失败
1144
在Windows平台上关于 ModelScorpe Audio 安装涉及 kwsbp 的问题
669
No module named 'ttsfrd'
1443
安装ttsfrd库提示找不到版本
971
modelscope 更新指定版本
443
pip install ttsfrd 报错
1111
ttsfrd 是不开源的吗
3929
展开全部
+关注
Dev-Talk
文章
问答
视频
来源圈子
更多
智能语音交互
168
+ 订阅
相关产品
智能语音交互
文档详情
产品详情
相关文章
更多
Ubuntu20.04搭建嵌入式linux网络加载内核、设备树和根文件系统
CogAgent-9B:智谱 AI 开源 GLM-PC 的基座模型,专注于预测和执行 GUI 操作,可应用于自动化交互任务
ShowUI:新加坡国立联合微软推出用于 GUI 自动化的视觉-语言-操作模型
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
基于Ubuntu-22.04安装K8s-v1.28.2实验(三)数据卷挂载NFS(网络文件系统)
AI 场景下如何构建运维的标准化能力?SOMA 智能运维计划发布 | 2024 龙蜥大会
探索软件测试的未来:自动化与AI的融合之路移动应用开发的新纪元:从原生到跨平台
利用Python实现简单的机器学习模型软件测试的艺术与科学:探索自动化测试框架的奥秘
微软提出自动化神经网络训练剪枝框架OTO,一站式获得高性能轻量化模型
创建一个有效的GUI自动化框架