产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
新手上云
云上应用构建
云上数据管理
云上探索人工智能
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
热门
百炼大模型
Modelscope模型即服务
弹性计算
云原生
数据库
云效DevOps
龙蜥操作系统
平头哥
钉钉开放平台
物联网
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
支持服务
镜像站
码上公益
开发者社区
>
ModelScope模型即服务
>
语音
>
视频
>
正文
如何当好人类的第三只眼?看见语音,快速准确又省钱
发布者:
Dev-Talk
2023-02-07 18:03:06
50553
Dev-Talk
+关注
视频介绍
如何当好人类的第三只眼?看见语音,快速准确又省钱
相关视频
6分53秒
AI 求职季,通义灵码助你备战技术面试
阿里云云原生
304播放
99分15秒
职场 landing 干货:通义灵码实战分享局
81405播放
65分11秒
AI求职季|程序员坦白局,AI时代的职业选择与未来
Dev-Talk
68141播放
1分18秒
通义灵码高效编程实践营——云工开物高校训练营西安站开营仪式
阿里云云原生
370播放
65分38秒
大学生如何用通义灵码解锁高效编程学习与实战
Dev-Talk
288播放
7分2秒
通义灵码入职阿里云,看看新同事灵不灵?
阿里云云原生
384播放
0分25秒
首个 AI 程序员通义灵码入职阿里云,未来20%的代码由它编写
阿里云云原生
420播放
22分58秒
阿里云智能编码助手通义灵码详解
Dev-Talk
492播放
8分47秒
AI 编码达人养成计划:用通义灵码完成3大高校场景体验
通义灵码
6427播放
8分47秒
利用通义灵码基于Java+Spring+MVC开发用户注册登录网站
Dev-Talk
640播放
ModelScope模型即服务
语音
+关注
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域
热门文章
热门讨论
CosyVoice 2.0:阿里开源升级版语音生成大模型,支持多语言和跨语言语音合成,提升发音和音色等的准确性
79
ChatTTSPlus:开源文本转语音工具,支持语音克隆,是 ChatTTS 的扩展版本
44
Freestyler:微软联合西工大和香港大学推出说唱音乐生成模型,支持控制生成的音色、风格和节奏等
37
Fish Speech 1.5:Fish Audio 推出的零样本语音合成模型,支持13种语言
67
Clone-voice:开源的声音克隆工具,支持文本转语音或改变声音风格,支持16种语言
77
ClearerVoice-Studio:阿里通义开源的语音处理框架,提供语音增强、分离和说话人提取等功能
76
KAN-TTS 在 conda 环境下无法安装 ttsfrd
1242
Voice-Pro:开源AI音频处理工具,集成转录、翻译、TTS等一站式服务
80
使用开源的模型(像speech_sambert-hifigan_tts_zhida_zh-cn_16k)进行语音合成任务的推理时,推理速度太慢了,500字大约需要1分钟,为什么会这么慢
588
语音识别
672
展开全部
modelscope上跑报错,提示要pip install ttsfrd,搞不定
7815
关于 Windows平台上 ttsfrd 库的问题。
1766
KeyError: 'asr-inference is not in the pipelines r
2033
ttsfrd 是不开源的吗
3903
No module named 'funasr.modules.eend_ola.utils'
502
目录空间都删的只剩2G了,还报OSError: [Errno 122] Disk quota exc
1034
No module named 'ttsfrd'
1387
PyTorch Transformer 英中翻译超详细教程
945
pip安装语音领域模型依赖报错。
473
在Windows平台上关于 ModelScorpe Audio 安装涉及 kwsbp 的问题
632
展开全部
+关注
Dev-Talk
文章
问答
视频
来源圈子
更多
智能语音交互
168
+ 订阅
相关产品
智能语音交互
文档详情
产品详情
相关文章
更多
有道开源的国产语音库EmotiVoice爆火了!具有情绪控制功能的语音合成引擎!
docker基本命令学习 | Docker网络、Docker镜像发布
【网络编程】第2章(3) 客户软件的设计算法和实现技术
【Docker】Docker中network的概要、常用命令、网络模式以及底层ip和容器映射变化的详细讲解
(服务器&客户端)网络通信是怎么实现的?7000字爆肝----原来java网络编程技术功不可没(多线程,URL,InetAddressm,TCP,UDP)集结
《云原生网络数据面可观测性最佳实践》——二、全景剖析阿里云容器网络数据链路——6. ASM Istio 模式架构设计(上)
《云原生网络数据面可观测性最佳实践》——二、全景剖析阿里云容器网络数据链路——6. ASM Istio 模式架构设计(中)
《云原生网络数据面可观测性最佳实践》——二、全景剖析阿里云容器网络数据链路——6. ASM Istio 模式架构设计(下)
巧用千寻位置GNSS软件|CAD功能全解析
《Cisco IPv6网络实现技术(修订版)》一2.4 在Cisco IOS软件技术上配置IPv6