语音技术的搜索结果_第20页-阿里云开发者社区

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

AI终于能听懂宝宝说话了！ChildMandarin：智源研究院开源的低幼儿童中文语音数据集，覆盖22省方言

ChildMandarin是由智源研究院与南开大学联合推出的开源语音数据集，包含41.25小时3-5岁儿童普通话语音数据，覆盖中国22个省级行政区，为儿童语音识别和语言发展研究提供高质量数据支持。

# 智能语音交互 # 数据采集 # 人工智能 # 自然语言处理 # 安全 # 语音技术

游客cfnmixfmgdqcw

|

8月前

|

问答

我使用了语音合成CosyVoice大模型的api，并且使用了文档上面贴图的python sdk,报错

# Python # 开发工具 # 语音技术 # API

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

ACTalker：港科大联合腾讯清华推出，多模态驱动的说话人视频生成神器

ACTalker是由香港科技大学联合腾讯、清华大学研发的端到端视频扩散框架，采用并行Mamba结构和多信号控制技术，能生成高度逼真的说话人头部视频。

# 视觉智能开放平台 # 人工智能 # 语音技术

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

重定义数字人交互！OmniTalker：阿里推出实时多模态说话头像生成框架，音视频实现唇语级同步

阿里巴巴推出的OmniTalker框架通过Thinker-Talker架构实现文本驱动的实时说话头像生成，创新性采用TMRoPE技术确保音视频同步，支持流式多模态输入处理。

# 虚拟数字人 # 机器学习/深度学习 # 人工智能 # 编解码 # 机器人 # 语音技术

小华同学ai

|

8月前

|

博文

25.9K star！AI一键生成高清短视频，这个开源神器让内容创作起飞！

"MoneyPrinterTurbo 是基于AI大模型的全自动短视频生成工具，只需输入主题，3分钟即可生成包含智能脚本、AI配音、专业字幕和流畅画面的高清视频

# 人工智能 # 语音技术 # iOS开发 # Docker # MacOS

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Dolphin：40语种+22方言！清华联合海天瑞声推出的语音识别大模型，识别精度超Whisper两代

Dolphin是清华大学与海天瑞声联合研发的语音识别大模型，支持40种东方语言和22种中文方言，采用CTC-Attention混合架构，词错率显著低于同类模型。

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 语音技术 # Python

阿里云开发者

|

8月前

|

博文

全模态模型Qwen2.5-Omni开源，7B尺寸实现全球最强性能

通义千问Qwen2.5-Omni-7B正式开源，作为首个端到端全模态大模型，支持文本、图像、音频和视频等多种输入形式，实时生成文本与自然语音合成输出。它在多模态融合任务测评中刷新纪录，性能远超同类模型。Qwen2.5-Omni采用Thinker-Talker双核架构，实现语义理解与语音生成高效协同，以小尺寸7B参数让全模态大模型广泛应用成为可能，现已在魔搭社区和Hugging Face同步开源。

# 人工智能 # 自然语言处理 # 算法 # 语音技术 # 开发者

nefelibata

|

8月前

|

博文

合力亿捷云客服系统：2025年大模型如何重塑全渠道对话体验

2025年，以DeepSeek等大模型为核心的智能客服系统，突破传统效率瓶颈，通过全渠道整合、多模态交互、个性化服务与情感智能，重构企业客户互动模式。从机械应答到认知共情，从单一文本到多维交互，大模型赋能客服系统成为企业价值创造的战略资产，推动客户服务迈向智能化新纪元。

# 客服工作台 # 自然语言处理 # 搜索推荐 # 机器人 # 数据挖掘 # 语音技术

modelscope

|

8月前

|

博文

|

来自： ModelScope模型即服务

重磅发布｜支持东方40语种+中国22方言的新SOTA语音大模型Dolphin开源啦！

在当今数字化时代，语音识别技术已成为人机交互的关键桥梁，广泛应用于智能客服、语音助手、会议转录等众多领域。

# 机器学习/深度学习 # 自然语言处理 # 人机交互 # 语音技术 # 开发者

游客u47je7pgqayge

|

8月前

|

问答

|

来自： ModelScope模型即服务

funasr 微调没有效果？微调数据量是多少，如何调整batch_size

# 智能语音交互 # 语音技术

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

语音技术