大模型
产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
查看 “
” 全部搜索结果
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
热门
百炼大模型
Modelscope模型即服务
弹性计算
通义灵码
云原生
数据库
云效DevOps
龙蜥操作系统
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
镜像站
开发者社区
>
ModelScope模型即服务
>
语音
>
视频
>
正文
如何当好人类的第三只眼?看见语音,快速准确又省钱
发布者:
Dev-Talk
2023-02-07 18:03:06
50648
Dev-Talk
+关注
视频介绍
如何当好人类的第三只眼?看见语音,快速准确又省钱
相关视频
193分4秒
CommunityOverCode Asia 2025 · 阿里云云原生议题回看 Messaging 专题、Observability 专题
81播放
ModelScope模型即服务
语音
+关注
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域
热门文章
热门讨论
Dolphin:40语种+22方言!清华联合海天瑞声推出的语音识别大模型,识别精度超Whisper两代
2286
CosyVoice 2.0:阿里开源升级版语音生成大模型,支持多语言和跨语言语音合成,提升发音和音色等的准确性
6627
FireRedASR:精准识别普通话、方言和歌曲歌词!小红书开源工业级自动语音识别模型
2149
三行代码实现实时语音转文本,支持自动断句和语音唤醒,用 RealtimeSTT 轻松创建高效语音 AI 助手
1785
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
1696
SpeechGPT 2.0:复旦大学开源端到端 AI 实时语音交互模型,实现 200ms 以内延迟的实时交互
1644
Text to Bark:让狗狗听懂人话!全球首个AI"狗语"生成器,137种狗狗口音任君挑选
906
Step-Audio:开源语音交互新标杆!这个国产AI能说方言会rap,1个模型搞定ASR+TTS+角色扮演
928
百聆:集成Deepseek API及语音技术的开源AI语音对话助手,实时交互延迟低至800ms
2556
Clone-voice:开源的声音克隆工具,支持文本转语音或改变声音风格,支持16种语言
1611
展开全部
关于 Windows平台上 ttsfrd 库的问题。
3894
modelscope上跑报错,提示要pip install ttsfrd,搞不定
10047
目录空间都删的只剩2G了,还报OSError: [Errno 122] Disk quota exc
1796
KeyError: 'asr-inference is not in the pipelines r
2870
funasr 微调没有效果?微调数据量是多少,如何调整batch_size
179
GPU相比CPU并没有明显提高uniasr语音识别和语音合成的推理速度
1920
使用SambertHifigan个性化语音合成-中文-预训练-16k生成的声音怎么调节语速呢?
886
ttsfrd 是不开源的吗
4315
UniASR如何进行流式语音识别?
1448
最佳实践中创建虚拟环境报错,请问什么情况?
473
展开全部
+关注
Dev-Talk
文章
问答
视频
来源圈子
更多
智能语音交互
167
+ 订阅
相关产品
智能语音交互
文档详情
产品详情
相关文章
更多
CI/CD与模型监控平台集成MLOps系统实现的全面路径
MCP与企业数据集成:ERP、CRM、数据仓库的统一接入
MCP vs 传统集成方案:REST API、GraphQL、gRPC的终极对比
AI-Compass NLP2SQL模块:集成Chat2DB、DB-GPT、MindsDB等核心工具,实现自然语言到SQL转换的智能化数据查询生态系统
详细阐述 TCP、UDP、ICMPv4 和 ICMPv6 协议-以及防火墙端口原理优雅草卓伊凡
10分钟,用RAG搭建专业钉钉/飞书客服机器人
鸿蒙OS Next与安卓系统的比较
Golang深入浅出之-Go语言指针面试必知:理解与使用指针
鸿蒙与安卓系统简单对比,绝非追求三分天下。
指针与指针面试真题