智能语音交互的搜索结果_热门_第19页-阿里云开发者社区

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

GPT-4o mini TTS：OpenAI 推出轻量级文本转语音模型！情感操控+白菜价冲击配音圈

GPT-4o mini TTS 是 OpenAI 推出的轻量级文本转语音模型，支持多语言、多情感控制，适用于智能客服、教育学习、智能助手等多种场景。

# 智能语音交互 # 人工智能 # 自然语言处理 # 语音技术 # 开发者

AI_WX_3307623172

|

博文

能力介绍——ASR语音识别/TTS合成

ASR（自动语音识别）有电话机器人，VOS线路问题或要演示站AI技术支持，外呼中心搭建找博主。VX_ID：3307623172。就是将麦克风采集到的自然声音转化为文字的过程，相当于人的耳朵+大脑（一部分）。

# 智能语音交互 # 智能语音交互 # 存储 # 人工智能 # 自然语言处理 # 机器人 # 大数据 # 定位技术 # 语音技术 # 数据库 # 智能硬件

技术小达人

|

博文

|

来自： ModelScope模型即服务

INTERSPEECH 2022论文解读｜Paraformer: 高识别率、高计算效率的单轮非自回归端到端语音识别模型

INTERSPEECH 是由国际语音通讯协会（International Speech Communication Association, ISCA）创办的语音信号处理领域顶级旗舰国际会议。历届 INTERSPEECH 会议都备受全球各地语音语言领域人士的广泛关注。本文介绍一种具有高识别率与计算效率的单轮非自回归模型 Paraformer。该论文已被 INTERSPEECH 2022 接收。

# 智能语音交互 # 云原生大数据计算服务 MaxCompute # 智能语音交互 # 机器学习/深度学习 # 自然语言处理 # 大数据 # 语音技术 # vr&ar

vohelon

|

博文

|

来自：通义大模型

通义听悟的优势及实际应用场景

# 智能语音交互 # 智能语音交互 # 大模型服务平台百炼 # 自然语言处理 # 语音技术

小猫娃来啦

|

博文

前端（十六）——微信小程序语音转文字，文字转语音功能的实现

# 智能语音交互 # 智能语音交互 # 小程序 # 前端开发 # 算法 # API # 语音技术

croyantssincères.

|

博文

语音识别技术的原理与应用

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 自然语言处理 # 语音技术 # 数据安全/隐私保护 # 智能硬件

叫做饺子

|

博文

视频字幕自动生成

8月更文挑战第12天

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 自然语言处理 # 算法 # 搜索推荐 # 语音技术

风吹落叶花飘荡

|

博文

语音识别教程：Whisper

本文是一份详细的Whisper语音识别模型使用教程，包括了FFmpeg的安装、Whisper模型的安装与使用，以及如何实现实时录制音频并转录的步骤和代码示例，旨在帮助用户基于Whisper和GPT创建AI字幕。

# 智能语音交互 # 智能语音交互 # 人工智能 # 语音技术 # Windows

baker_zhuang

|

博文

SenseVoice实现语音转文字

这篇文章介绍了如何使用SenseVoice实现语音转文字的功能，包括通过Docker部署服务、使用网页界面或API进行语音文件的转换，并提供了详细的部署与使用步骤。

# 智能语音交互 # 智能语音交互 # API # Docker # 容器

探索云世界动手实践

|

8月前

|

博文

|

来自：大数据与机器学习

让小程序开口说话：DeepSeek语音交互开发指南

本文介绍如何利用DeepSeek语音交互技术构建智能语音助手，涵盖从安装声音采集设备、训练语言理解模型到设计语音控制界面的全过程。通过生活化场景，如深夜查找教程、旅行中寻找餐厅等，展示如何实现自然对话。此外，还深入探讨多轮对话记忆、情感计算及智能家居控制等进阶功能，帮助开发者创建会倾听、善思考的语音应用。最后，提供性能优化与安全防护建议，引领读者进入人机共生的新时代。

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 小程序 # 安全 # 开发者 # 智能硬件

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

智能语音交互