大模型
产品
解决方案
文档与社区
权益中心
定价
云市场
合作伙伴
支持与服务
了解阿里云
HOT
查看 “
” 全部搜索结果
AI 助理
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
热门
百炼大模型
Modelscope模型即服务
弹性计算
通义灵码
云原生
数据库
云效DevOps
龙蜥操作系统
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
镜像站
开发者社区
>
ModelScope模型即服务
>
语音
>
视频
>
正文
如何当好人类的第三只眼?看见语音,快速准确又省钱
发布者:
Dev-Talk
2023-02-07 18:03:06
50657
Dev-Talk
+关注
视频介绍
如何当好人类的第三只眼?看见语音,快速准确又省钱
相关视频
9分25秒
SLS新版告警入门——Webhook集成
日志服务SLS
619播放
12分59秒
SLS日志审计与威胁情报集成实战
日志服务SLS
458播放
11分11秒
日志审计多帐号采集方案升级--资源目录集成
日志服务SLS
529播放
27分39秒
RocketMQ消息集成:多类型业务消息专题-普通消息
云栖号资讯小哥
587播放
55分34秒
钉钉开发者说丨钉钉酷应用-开发篇 《酷应用开发集成入门》
Dev-Talk
932播放
27分34秒
Apache Flink 与 Apache Hive 的集成 | 开源大数据生态专场
开发者说
1256播放
12分35秒
RAM角色集成企业ADFS身份认证
知云直播
995播放
35分57秒
待集成、连接、丰富—MaxCompute生态再出发 | 大数据生态专场
开发者说
1193播放
5分1秒
盛森-智能门店是人工智能技术综合应用的集成体现
开发者说
592播放
39分46秒
阿里云 OpenAPI / SDK 体系介绍
社区助手
6085播放
ModelScope模型即服务
语音
+关注
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域
热门文章
热门讨论
Dolphin:40语种+22方言!清华联合海天瑞声推出的语音识别大模型,识别精度超Whisper两代
2625
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
1922
EmotiVoice:网易开源AI语音合成黑科技,2000+音色情感可控
611
三行代码实现实时语音转文本,支持自动断句和语音唤醒,用 RealtimeSTT 轻松创建高效语音 AI 助手
1930
FireRedASR:精准识别普通话、方言和歌曲歌词!小红书开源工业级自动语音识别模型
2371
TIGER:清华突破性模型让AI「听觉」进化:参数量暴降94%,菜市场都能分离清晰人声
477
SpeechGPT 2.0:复旦大学开源端到端 AI 实时语音交互模型,实现 200ms 以内延迟的实时交互
1768
AI终于能听懂宝宝说话了!ChildMandarin:智源研究院开源的低幼儿童中文语音数据集,覆盖22省方言
574
CosyVoice 2.0:阿里开源升级版语音生成大模型,支持多语言和跨语言语音合成,提升发音和音色等的准确性
6819
Text to Bark:让狗狗听懂人话!全球首个AI"狗语"生成器,137种狗狗口音任君挑选
1002
展开全部
关于 Windows平台上 ttsfrd 库的问题。
4004
modelscope上跑报错,提示要pip install ttsfrd,搞不定
10109
使用不带interval的数据进行训练报错。请问如何修改?或者如何制作带有interval的数据?
293
语音唤醒可以自定义唤醒词嘛?比如“小云,小云”换成自己的命令词?如何训练模型
1311
用通用数据格式训练会报错,请问代码中需要做哪些修改呢?
317
模型如何下载到本地,并通过本地pytorch或tensorflow runtime 运行推理?
742
关于 modelscope-funasr 报错的问题。
1399
KeyError: 'asr-inference is not in the pipelines r
2918
阿里标准格式的带有interval的可以训练,通用数据格式只有prosody和wav训练声码器报错。
325
目录空间都删的只剩2G了,还报OSError: [Errno 122] Disk quota exc
1862
展开全部
+关注
Dev-Talk
文章
问答
视频
来源圈子
更多
智能语音交互
167
+ 订阅
相关产品
智能语音交互
文档详情
产品详情
相关文章
更多
鸿蒙5开发宝藏案例分享---平板开发实践
鸿蒙5开发宝藏案例分享---三折叠应用开发分享
鸿蒙5开发宝藏案例分享---Pura X开发案例分享
鸿蒙5开发宝藏案例分享---折叠屏开发实践
鸿蒙5开发宝藏案例分享---体验流畅的首页信息流
鸿蒙5开发宝藏案例分享---AI辅助图文内容高效编创
鸿蒙5开发宝藏案例分享---快捷触达的骑行体验
鸿蒙5开发宝藏案例分享---在线短视频流畅切换
鸿蒙ArkUI实现的Slider组件
鸿蒙(HarmonyOS)项目方舟框架(ArkUI)之Slider组件