大模型
产品
解决方案
权益
定价
云市场
伙伴
服务
了解阿里云
查看 “
” 全部搜索结果
AI 助理
文档
备案
控制台
开发者社区
首页
计算机视觉
自然语言处理
语音
多模态
科学计算
魔搭社区官网
探索云世界
热门
百炼大模型
Modelscope模型即服务
弹性计算
通义灵码
云原生
数据库
云效DevOps
龙蜥操作系统
云计算
弹性计算
无影
存储
网络
倚天
云原生
容器
serverless
中间件
微服务
可观测
消息队列
数据库
关系型数据库
NoSQL数据库
数据仓库
数据管理工具
PolarDB开源
向量数据库
大数据
大数据计算
实时数仓Hologres
实时计算Flink
E-MapReduce
DataWorks
Elasticsearch
机器学习平台PAI
智能搜索推荐
数据可视化DataV
人工智能
机器学习平台PAI
视觉智能开放平台
智能语音交互
自然语言处理
多模态模型
pythonsdk
通用模型
开发与运维
云效DevOps
钉钉宜搭
镜像站
开发者社区
ModelScope模型即服务
语音
正文
用Wan2.2-S2V语音驱动视频为什么时间这么长速度这么慢?
展开
收起
游客rw3rxbztqqv34
2025-12-02 19:51:20
119
分享
版权
0
条回答
写回答
取消
提交回答
相关问答
访问ECS服务器的网站提示“由于你访问的URL可能对网站造成安全威胁,您的访问被阻断”,这是什么原因?
136733
16
0
#支付宝 身份验证失败(人气大爆发,一会再试试)?
11268
2
0
支付宝H5 下载的时候,提示 【请确保该下载文件来源安全,如需浏览,请长按网址复制后使用浏览器访问】
268711
11
0
#支付宝 授权提示请在支付宝客户端打开链接
18935
19
0
购买阿里国外的云服务器是否可以访问谷歌?
87482
49
0
this xml file does not appear to have any style in
55097
11
0
今天刚刚买的阿里云香港服务器,国内无法访问,坑啊
35765
17
0
哪位有编译好的cdc 2.2.0版本能能试用flink 1.14.2的包呀?
3267
18
0
轻量级应用服务器端口问题(打不开)
32407
21
0
LoRa的网络覆盖能力范围是怎么样的?
4312
1
0
ModelScope模型即服务
语音
包括语音识别、语音合成、语音唤醒、声学设计及信号处理、声纹识别、音频事件检测等多个领域
我要提问
相关文章
面向能效和低延迟的语音控制智能家居:离线语音识别与物联网集成方案——论文阅读
基于MFCC(梅尔频率倒谱系数)和GMM(高斯混合模型)的语音识别
小结
构建智能客服:阿里云智能语音交互+函数计算的低成本方案
docker安装部署FunASR
相关解决方案
更多
无限画布:让视频特效自由生长
一键生成PPT及讲解视频
告别低效沟通,使用大模型发起语音通话
零代码搭建企业级图像与视频创作平台
通义听悟:全场景语音对话分析,自动化提炼业务洞察
热门讨论
热门文章
关于 Windows平台上 ttsfrd 库的问题。
提供能在其他服务器ubuntu环境下跑通的脚本,亲测有效
modelscope 更新指定版本
modelscope报错
auto_speech_recognition如何使用本地音频文件?
SambertHifigan个性化语音合成-中文-预训练-16k 语速太快了怎么设置慢一点
modelscope上跑报错,提示要pip install ttsfrd,搞不定
模型如何下载到本地,并通过本地pytorch或tensorflow runtime 运行推理?
请问下modelscope TTS 如何调整语速语调,用modelscope的pipeline
iic/speech_sambert-hifigan_tts_zh-cn_16k模型实时合成
展开全部
docker安装部署FunASR
CosyVoice 2.0:阿里开源升级版语音生成大模型,支持多语言和跨语言语音合成,提升发音和音色等的准确性
Text to Bark:让狗狗听懂人话!全球首个AI"狗语"生成器,137种狗狗口音任君挑选
FireRedASR:精准识别普通话、方言和歌曲歌词!小红书开源工业级自动语音识别模型
3D-Speaker:阿里通义开源的多模态说话人识别项目,支持说话人识别、语种识别、多模态识别、说话人重叠检测和日志记录
Dolphin:40语种+22方言!清华联合海天瑞声推出的语音识别大模型,识别精度超Whisper两代
Kokoro-TTS:超轻量级文本转语音模型,支持生成多种语言和多种语音风格
Clone-voice:开源的声音克隆工具,支持文本转语音或改变声音风格,支持16种语言
覆盖16省方言的老人语音数据集!SeniorTalk:智源研究院开源全球首个超高龄老年人中文语音数据集
ClearerVoice-Studio:阿里通义开源的语音处理框架,提供语音增强、分离和说话人提取等功能
展开全部
还有其他疑问?
咨询AI助理