智能语音交互的搜索结果_文章-阿里云开发者社区

游客dng4gjyb342he

|

3月前

|

博文

基于MFCC（梅尔频率倒谱系数）和GMM（高斯混合模型）的语音识别

# 智能语音交互 # 智能语音交互 # 并行计算 # 算法 # 语音技术

DuHz

|

3月前

|

博文

|

来自：物联网

面向能效和低延迟的语音控制智能家居：离线语音识别与物联网集成方案——论文阅读

本文提出一种面向能效与低延迟的离线语音控制智能家居方案，通过将关键词识别（KWS）集成至终端设备，结合去中心化Mesh网络与CoAP协议，实现本地化语音处理。相较云端方案，系统能耗降低98%，延迟减少75%以上，显著提升响应速度与能源效率，为绿色智能家居提供可行路径。（236字）

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 算法 # 物联网 # 语音技术 # 智能硬件

荔枝科研社

|

4月前

|

博文

【语音识别】基于K近邻分类算法的语音情感识别（Matlab代码实现）

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 移动开发 # 算法 # 人机交互 # 语音技术

34789737

|

4月前

|

博文

免费版的配音软件，支持童声男声女声不同声音选项，语音转文字软件推荐支持多种声音

# 智能语音交互 # 智能语音交互 # 人工智能 # API # 语音技术

叮叮1

|

5月前

|

博文

自动生成+语音转写，办公必备！2025年智能会议纪要10＋工具！

在当今快节奏的商业环境中，会议已成为组织沟通和决策的核心环节。然而，低效的会议管理往往导致时间浪费和信息丢失。会议纪要工具通过语音识别、智能摘要等技术，实现会议内容自动记录与结构化整理，提升会议效率与信息留存，助力企业优化知识管理与团队协作。不仅简化了传统手工记录的过程，更通过人工智能、自然语言处理等先进技术，实现了会议内容的自动捕捉、智能分析和结构化整理。这类工具已成为现代企业提升生产力、优化知识管理的重要基础设施，帮助团队从繁琐的会议记录工作中解放出来，将更多精力投入。

# 智能语音交互 # 智能语音交互 # 人工智能 # 自然语言处理 # 语音技术 # vr&ar # 数据安全/隐私保护

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Dolphin：40语种+22方言！清华联合海天瑞声推出的语音识别大模型，识别精度超Whisper两代

Dolphin是清华大学与海天瑞声联合研发的语音识别大模型，支持40种东方语言和22种中文方言，采用CTC-Attention混合架构，词错率显著低于同类模型。

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 语音技术 # Python

技术员阿伟

|

9月前

|

博文

《深度剖析：将先进语音识别技术融入鸿蒙系统AI应用》

语音识别技术是人工智能的重要组成部分，而鸿蒙系统凭借其分布式架构和强大能力，为语音技术的应用开辟了新方向。本文介绍了鸿蒙系统的智能语音交互架构，包括语音输入、识别、处理、合成及应用层，并探讨了如何选择适配的语音识别方案。同时，文章分析了语音数据优化、多语言支持、实时性等关键问题，以及如何将语音技术与智能家居、车载、办公等场景深度融合。随着技术进步，鸿蒙生态中的语音识别将带来更智能的用户体验。

# 智能语音交互 # 智能语音交互 # 人工智能 # 自然语言处理 # 算法 # 语音技术 # 开发者

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

WhisperChain：开源 AI 实时语音转文字工具！自动消噪优化文本，效率翻倍

WhisperChain 是一款基于 Whisper.cpp 和 LangChain 的开源语音识别工具，能够实时将语音转换为文本，并自动清理和优化文本内容，适用于会议记录、写作辅助等多种场景。

# 智能语音交互 # 智能语音交互 # 人工智能 # API # 语音技术 # iOS开发 # MacOS

探索云世界动手实践

|

10月前

|

博文

|

来自：大数据与机器学习

让小程序开口说话：DeepSeek语音交互开发指南

本文介绍如何利用DeepSeek语音交互技术构建智能语音助手，涵盖从安装声音采集设备、训练语言理解模型到设计语音控制界面的全过程。通过生活化场景，如深夜查找教程、旅行中寻找餐厅等，展示如何实现自然对话。此外，还深入探讨多轮对话记忆、情感计算及智能家居控制等进阶功能，帮助开发者创建会倾听、善思考的语音应用。最后，提供性能优化与安全防护建议，引领读者进入人机共生的新时代。

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 小程序 # 安全 # 开发者 # 智能硬件

蚝油菜花

|

10月前

|

博文

|

来自： ModelScope模型即服务

Step-Audio：开源语音交互新标杆！这个国产AI能说方言会rap，1个模型搞定ASR+TTS+角色扮演

Step-Audio 是由阶跃星辰团队推出的开源语音交互模型，支持多语言、方言和情感表达，能够实现高质量的语音识别、对话和合成。本文将详细介绍其核心功能和技术原理。

# GPU云服务器 # 智能语音交互 # 智能语音交互 # 人工智能 # 自然语言处理 # 语音技术 # 异构计算 # 智能硬件

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

智能语音交互