语音技术的搜索结果_文章_第4页-阿里云开发者社区

阿里云云原生

|

24天前

|

博文

|

本方案利用函数计算 FC 部署 Web 应用，调用百炼模型服务实现 PPT 到视频的自动转换。视觉模型智能理解 PPT 图文内容，快速生成相匹配的解说词；文本模型对解说词进行优化，提高其可读性和吸引力；语音模型则根据解说词生成生动流畅的旁白音频。整个过程高度集成，只需一键操作，系统即可自动整合图片、文本和音频素材，快速生成对应讲解视频。

# 函数计算 # 对象存储 # 存储 # 人工智能 # Serverless # 语音技术 # 对象存储

阿里云开发者

|

26天前

|

博文

过年啦，做一个春节贺卡生成器

本文介绍了如何获取和利用现有的大模型资源，结合魔笔低代码，低成本、高效率地打造一个 AI 春节贺卡生成器。

# 函数计算 # 云数据库 RDS MySQL 版 # 智能语音交互 # 人工智能 # 前端开发 # 关系型数据库 # API # 语音技术

算精通

|

27天前

|

博文

|

来自：阿里云百炼

【1月更文挑战第22天】

# 人工智能 # 移动开发 # 自然语言处理 # JavaScript # 语音技术

蚝油菜花

|

27天前

|

博文

|

来自： ModelScope模型即服务

百聆：集成Deepseek API及语音技术的开源AI语音对话助手，实时交互延迟低至800ms

百聆是一款开源的AI语音对话助手，结合ASR、VAD、LLM和TTS技术，提供低延迟、高质量的语音对话体验，适用于边缘设备和低资源环境。

# 智能语音交互 # 人工智能 # 自然语言处理 # API # 语音技术 # 智能硬件

蚝油菜花

|

27天前

|

博文

|

来自： ModelScope模型即服务

Kokoro-TTS：超轻量级文本转语音模型，支持生成多种语言和多种语音风格

Kokoro-TTS 是一款轻量级文本转语音模型，支持多语言和多语音风格生成，具备实时处理能力和低资源占用，适用于多种应用场景。

# 智能语音交互 # 人工智能 # 自然语言处理 # 并行计算 # API # 语音技术

阿里云智能-计算巢-琥颐

|

28天前

|

博文

|

来自：计算巢

企业微信接收语音消息并自动回复

本文介绍如何在企业微信中通过应用机器人实现语音消息的自动回复。具体步骤包括：创建企业微信应用，获取AgentID和Secret；使用AppFlow模版创建连接流并配置鉴权凭证；选择语音识别模型和大模型应用（如通义系列）进行自动回复；配置企业微信应用接收消息API及可信IP；最后测试应用功能。通过这些步骤，用户可以高效地利用大模型技术提升企业微信的使用体验。

# 大模型服务平台百炼 # 机器人 # API # 语音技术 # 开发者

技术员阿伟

|

28天前

|

博文

《探秘鸿蒙Next：模型轻量化的能源效益衡量之道》

在鸿蒙Next生态中，模型轻量化显著提升设备能源效益。通过功耗指标（CPU、GPU、整体设备）、运行时间与能耗比值、电池续航（实际场景和极端测试）、散热情况（温度变化、散热能耗）及资源占用（内存、存储）的综合衡量，可全面评估轻量化模型对能源效率的优化效果，为设备性能提升提供依据。

# GPU云服务器 # 存储 # 传感器 # 监控 # 语音技术 # 异构计算

魔搭ModelScope社区小助手

|

28天前

|

博文

|

来自： ModelScope模型即服务

VITA-1.5: 迈向GPT-4o级实时视频-语音交互

近期，由南京大学和腾讯优图推出的VITA-1.5在魔搭开源。VITA-1.5支持视频，音频，文本输入，以及音频输出。

# 智能语音交互 # JSON # 测试技术 # 语音技术 # 数据格式 # UED

游客rajs3hal3ttfo

|

28天前

|

博文

推荐使用multiprocessing技术或者手动使用脚本创建多个解释器

本简介介绍了一款Python语音合成SDK的使用方法。首先，确保已安装Python3及setuptools，并从GitHub下载SDK，安装依赖后使用`python -m pip install .`完成安装。核心类`NlsSpeechSynthesizer`提供初始化、开始合成（`start`）和关闭（`shutdown`）方法，支持多线程处理，但建议使用`multiprocessing`以提高性能。示例代码展示了如何将合成的音频保存为文件，或通过流式播放减少延时。

# JSON # 语音技术 # 开发工具 # Python # Windows

hw2020hw

|

29天前

|

博文

昇腾AI行业案例（七）：基于 Conformer 和 Transformer 模型的中文语音识别

欢迎学习《基于 Conformer 和 Transformer 模型的中文语音识别》实验。本案例旨在帮助你深入了解如何运用深度学习模型搭建一个高效精准的语音识别系统，将中文语音信号转换成文字，并利用开源数据集对模型效果加以验证。

# 智能语音交互 # 机器学习/深度学习 # 数据采集 # 人工智能 # 语音技术 # Python

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

语音技术