语音技术的搜索结果_热门_第14页-阿里云开发者社区

kaixin321-44007

|

博文

通用模型和垂直模型的比较

# 人工智能 # 自然语言处理 # 语音技术

我们是幸福一家人

|

博文

探索深度学习中的注意力机制：原理、应用与未来展望

# 机器学习/深度学习 # 人工智能 # 自然语言处理 # 语音技术 # 计算机视觉

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

EmotiVoice：网易开源AI语音合成黑科技，2000+音色情感可控

EmotiVoice是网易有道开源的多语言语音合成系统，支持中英文2000多种音色，通过提示词控制情感输出，提供Web界面和API接口，具备语音克隆等先进功能。

# 智能语音交互 # 人工智能 # API # 语音技术 # Docker # 容器

开发者小助理

|

博文

|

来自： ModelScope模型即服务

“魔搭”来了！一文深度解读达摩院推出的AI模型社区

一文详解ModelScope魔搭社区，模型即服务开启AI开发使用新范式

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 达摩院 # 算法 # API # 语音技术 # 开发者 # 索引 # Python

ModelScope内容运营小助手

|

博文

Qwen2-Audio开源，让VoiceChat更流畅！

在一个通用的AI系统中，核心模型应该能够理解不同模态的信息。当前的大语言模型现在已经能够理解语言并进行推理，并且已经扩展到了更多的模态，包括视觉和音频。

# 对象存储 # 人工智能 # JSON # 语音技术 # Swift # 数据格式

bruce_xiaowei

|

博文

简介阿里云大模型的基本概况和产品矩阵

阿里云在大模型领域深入研究，推出了通义千问、通义万相、通义听悟等产品，涵盖自然语言处理、图像生成、语音识别等多个方面，同时提供行业专属模型和MaaS平台，致力于为企业和个人用户提供高效、智能的服务。

# 智能语音交互 # 智能语音交互 # 人工智能 # 自然语言处理 # 语音技术 # 开发工具 # 开发者

有路有乔-六月

|

博文

深度学习和强化学习有什么区别呢

【10月更文挑战第23天】深度学习和强化学习有什么区别呢

# 机器学习/深度学习 # 人工智能 # 算法 # 机器人 # 语音技术

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

三行代码实现实时语音转文本，支持自动断句和语音唤醒，用 RealtimeSTT 轻松创建高效语音 AI 助手

RealtimeSTT 是一款开源的实时语音转文本库，支持低延迟应用，具备语音活动检测、唤醒词激活等功能，适用于语音助手、实时字幕等场景。

# 智能语音交互 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 语音技术 # 异构计算

技术员阿伟

|

10月前

|

博文

《深度解析：全连接层—卷积神经网络中的关键纽带》

全连接层在卷积神经网络（CNN）中起着桥梁作用，将卷积层和池化层提取的局部特征整合为全局特征，实现分类或回归任务。每个神经元与前一层所有神经元相连，通过权重和偏置进行特征转换，并引入激活函数以增强非线性建模能力。尽管参数量大易导致过拟合，但可通过正则化、Dropout和批标准化等技术有效应对，从而提升模型性能。

# 云解析DNS # 机器学习/深度学习 # 自然语言处理 # 算法 # 语音技术

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Step-Audio：开源语音交互新标杆！这个国产AI能说方言会rap，1个模型搞定ASR+TTS+角色扮演

Step-Audio 是由阶跃星辰团队推出的开源语音交互模型，支持多语言、方言和情感表达，能够实现高质量的语音识别、对话和合成。本文将详细介绍其核心功能和技术原理。

# GPU云服务器 # 智能语音交互 # 智能语音交互 # 人工智能 # 自然语言处理 # 语音技术 # 异构计算 # 智能硬件

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

语音技术