语音技术的搜索结果_第9页-阿里云开发者社区

小华同学ai

|

5月前

|

博文

2.7K star！这个汉字工具库让中文处理变得超简单，开发者必备！

是一个功能全面的汉字工具库，提供拼音转换、笔画动画、偏旁查询、成语接龙、语音合成等20+种实用功能。支持Web/Node.js/小程序多端运行，仅需简单API调用即可实现复杂中文处理，是教育类应用、输入法开发、游戏设计的瑞士军刀

# 前端开发 # JavaScript # API # 语音技术 # 开发者

蚝油菜花

|

5月前

|

博文

|

来自： ModelScope模型即服务

别让创意卡在工具链！MiniMax MCP Server：MiniMax 开源 MCP 服务打通多模态生成能力，视频语音图像一键全搞定

MiniMax MCP Server 是基于模型上下文协议的多模态生成中间件，支持通过文本指令调用视频生成、图像创作、语音合成及声音克隆等能力，兼容主流客户端实现跨平台调用，采用检索增强生成技术保障内容准确性。

# 图像识别 # 人工智能 # 中间件 # API # 语音技术 # 开发者

蚝油菜花

|

5月前

|

博文

|

来自： ModelScope模型即服务

开源学习神器把2小时网课压成5分钟脑图！BiliNote：一键转录哔哩哔哩视频，生成结构化学习文档

本文介绍基于FastAPI与React构建的开源视频笔记工具BiliNote，其整合多模态AI技术实现视频内容结构化解析，支持跨平台视频源处理与本地化部署方案，提供从语音转写到智能摘要的全流程自动化能力。

# 图像识别 # 人工智能 # 前端开发 # 语音技术 # Docker # 容器

sysin

|

5月前

|

博文

Cisco NX-OS Software Release 9.3(15) - 数据中心网络操作系统

# Devops # API # 语音技术 # 数据中心 # 数据安全/隐私保护

大风2016

|

5月前

|

问答

|

来自：阿里云百炼

paraformer问题

# 大模型服务平台百炼 # 人工智能平台 PAI # Python # 语音技术

蚝油菜花

|

5月前

|

博文

|

来自： ModelScope模型即服务

覆盖16省方言的老人语音数据集！SeniorTalk：智源研究院开源全球首个超高龄老年人中文语音数据集

SeniorTalk是由智源研究院与南开大学联合推出的全球首个中文超高龄老年人对话语音数据集，包含202位75岁及以上老年人的55.53小时语音数据，涵盖16个省市的不同地域口音。

# 智能语音交互 # 数据采集 # 人工智能 # 数据处理 # 语音技术 # 智能硬件

蚝油菜花

|

5月前

|

博文

|

来自： ModelScope模型即服务

AI终于能听懂宝宝说话了！ChildMandarin：智源研究院开源的低幼儿童中文语音数据集，覆盖22省方言

ChildMandarin是由智源研究院与南开大学联合推出的开源语音数据集，包含41.25小时3-5岁儿童普通话语音数据，覆盖中国22个省级行政区，为儿童语音识别和语言发展研究提供高质量数据支持。

# 智能语音交互 # 数据采集 # 人工智能 # 自然语言处理 # 安全 # 语音技术

游客cfnmixfmgdqcw

|

5月前

|

问答

我使用了语音合成CosyVoice大模型的api，并且使用了文档上面贴图的python sdk,报错

# Python # 开发工具 # 语音技术 # API

蚝油菜花

|

5月前

|

博文

|

来自： ModelScope模型即服务

ACTalker：港科大联合腾讯清华推出，多模态驱动的说话人视频生成神器

ACTalker是由香港科技大学联合腾讯、清华大学研发的端到端视频扩散框架，采用并行Mamba结构和多信号控制技术，能生成高度逼真的说话人头部视频。

# 视觉智能开放平台 # 人工智能 # 语音技术

蚝油菜花

|

5月前

|

博文

|

来自： ModelScope模型即服务

重定义数字人交互！OmniTalker：阿里推出实时多模态说话头像生成框架，音视频实现唇语级同步

阿里巴巴推出的OmniTalker框架通过Thinker-Talker架构实现文本驱动的实时说话头像生成，创新性采用TMRoPE技术确保音视频同步，支持流式多模态输入处理。

# 虚拟数字人 # 机器学习/深度学习 # 人工智能 # 编解码 # 机器人 # 语音技术

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

语音技术