大模型
产品
解决方案
权益
定价
云市场
伙伴
服务
了解阿里云
查看 “
” 全部搜索结果
AI 助理
文档
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
热门
百炼大模型
Modelscope模型即服务
弹性计算
通义灵码
云原生
数据库
云效DevOps
龙蜥操作系统
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
镜像站
开发者社区
>
ModelScope模型即服务
>
语音
>
视频
>
正文
如何当好人类的第三只眼?看见语音,快速准确又省钱
发布者:
Dev-Talk
2023-02-07 18:03:06
50723
Dev-Talk
+关注
视频介绍
如何当好人类的第三只眼?看见语音,快速准确又省钱
相关视频
40分48秒
Apache RocketMQ x AI:面向异步化 Agent 的事件驱动架构
400播放
ModelScope模型即服务
语音
+关注
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域
热门文章
热门讨论
CosyVoice 2.0:阿里开源升级版语音生成大模型,支持多语言和跨语言语音合成,提升发音和音色等的准确性
8556
FireRedASR:精准识别普通话、方言和歌曲歌词!小红书开源工业级自动语音识别模型
3783
docker安装部署FunASR
110
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
3495
Dolphin:40语种+22方言!清华联合海天瑞声推出的语音识别大模型,识别精度超Whisper两代
4627
ClearerVoice-Studio:阿里通义开源的语音处理框架,提供语音增强、分离和说话人提取等功能
2617
Clone-voice:开源的声音克隆工具,支持文本转语音或改变声音风格,支持16种语言
2559
Kokoro-TTS:超轻量级文本转语音模型,支持生成多种语言和多种语音风格
2118
百聆:集成Deepseek API及语音技术的开源AI语音对话助手,实时交互延迟低至800ms
3807
SpeechGPT 2.0:复旦大学开源端到端 AI 实时语音交互模型,实现 200ms 以内延迟的实时交互
2671
展开全部
modelscope上跑报错,提示要pip install ttsfrd,搞不定
10879
有无语音分类的相关开源预训练模型推荐?主要是识别:御姐音、萝莉音、烟嗓、少年感 此类类似的
116
关于 Windows平台上 ttsfrd 库的问题。
4635
KeyError: 'asr-inference is not in the pipelines r
3233
wekws训练自定义数据集的误唤醒较高。
716
目录空间都删的只剩2G了,还报OSError: [Errno 122] Disk quota exc
2272
modelscope 更新指定版本
927
kantts 这个模型是什么东西啊,运行会报错
2450
modelscope报错
565
在Windows平台上关于 ModelScorpe Audio 安装涉及 kwsbp 的问题
1184
展开全部
+关注
Dev-Talk
文章
问答
视频
来源圈子
更多
智能语音交互
167
+ 订阅
相关产品
智能语音交互
文档详情
产品详情
相关文章
更多
软件测试面试题:交付一个性能测试项目,请阐述你的性能测试流程?
软件测试面试题:性能测试的核心原则是什么?
软件测试面试题:性能测试指标有哪些?
软件测试面试题:常见的性能测试方法有哪些?以及每类测试方法的目的是什么?
软件测试面试题:做性能测试时你用过哪种测试工具?请说明其工作原理或举例说明工作流程。
软件测试面试题:请分别针对性能测试、负载测试和压力测试试举一个简单的例子?
软件测试面试题:性能测试时,是不是必须进行参数化?为什么要创建参数?LoadRunner中如何创建参数?
软件测试面试题:简述性能测试的步骤。
软件测试面试题:怎么分析性能测试结果?
软件测试面试题:简述性能测试流程?