智能语音交互的搜索结果_热门_第3页-阿里云开发者社区

叮叮1

|

3月前

|

博文

自动生成+语音转写，办公必备！2025年智能会议纪要10＋工具！

在当今快节奏的商业环境中，会议已成为组织沟通和决策的核心环节。然而，低效的会议管理往往导致时间浪费和信息丢失。会议纪要工具通过语音识别、智能摘要等技术，实现会议内容自动记录与结构化整理，提升会议效率与信息留存，助力企业优化知识管理与团队协作。不仅简化了传统手工记录的过程，更通过人工智能、自然语言处理等先进技术，实现了会议内容的自动捕捉、智能分析和结构化整理。这类工具已成为现代企业提升生产力、优化知识管理的重要基础设施，帮助团队从繁琐的会议记录工作中解放出来，将更多精力投入。

# 智能语音交互 # 智能语音交互 # 人工智能 # 自然语言处理 # 语音技术 # vr&ar # 数据安全/隐私保护

DreamSpark

|

博文

音频基座大模型FunAudioLLM体验评测

一文带你详细了解音频基座大模型FunAudioLLM

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 自然语言处理 # 人机交互 # 语音技术 # 开发者

喜欢猪猪

|

博文

Spring Boot 接入大模型实战：通义千问赋能智能应用快速构建

【10月更文挑战第23天】在人工智能（AI）技术飞速发展的今天，大模型如通义千问（阿里云推出的生成式对话引擎）等已成为推动智能应用创新的重要力量。然而，对于许多开发者而言，如何高效、便捷地接入这些大模型并构建出功能丰富的智能应用仍是一个挑战。

# 自然语言处理 # 智能语音交互 # 智能语音交互 # 自然语言处理 # Java # API # 语音技术 # Spring

nicenelly

|

问答

什么是语音识别(ASR) ?

# 视频直播 # 智能语音交互 # 自然语言处理 # 智能语音交互 # 自然语言处理 # Java # 视频直播 # API # 语音技术 # 开发工具 # Android开发 # iOS开发 # 内存技术

ModelScope内容运营小助手

|

11月前

|

博文

基于开源技术的数字人实时对话：形象可自定义，支持语音输入，对话首包延迟可低至3s

魔搭社区最近上线了基于开源技术的数字人实时对话demo，无需预训练即可使用自定义的数字人形象进行实时对话，支持语音输入和实时对话。

# 虚拟数字人 # 智能语音交互 # 智能语音交互 # API # 语音技术 # 开发者 # 流计算 # UED

技术员阿伟

|

9月前

|

博文

《鸿蒙Next：让人工智能语音交互听懂每一种方言和口音》

鸿蒙Next系统通过丰富方言语音数据、优化语音识别模型、引入语音合成技术及用户反馈机制，大幅提升对不同方言和口音的识别能力。具体措施包括多渠道收集方言数据、建立动态数据库、采用深度学习算法、实现多任务学习与对抗训练、生成标准方言样本，并结合硬件如麦克风阵列技术优化语音输入质量。这些综合手段确保了语音交互的准确性和实时性，为用户提供更智能、便捷的服务。

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 算法 # 语音技术

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

FireRedASR：精准识别普通话、方言和歌曲歌词！小红书开源工业级自动语音识别模型

小红书开源的工业级自动语音识别模型，支持普通话、中文方言和英语，采用 Encoder-Adapter-LLM 和 AED 架构，实现 SOTA 性能。

# 智能语音交互 # 智能语音交互 # 人工智能 # 物联网 # 测试技术 # 语音技术 # Python

AI之家

|

博文

【深度学习】深度学习基本概念、工作原理及实际应用案例

深度学习是一种机器学习方法，它试图模拟人脑中的神经网络结构，以解决复杂的问题。深度学习的核心在于构建多层非线性处理单元（即神经元）的网络结构，这些网络可以从原始数据中自动提取特征并进行学习。

# 智能语音交互 # 自然语言处理 # 智能语音交互 # 机器学习/深度学习 # 算法 # PyTorch # TensorFlow # 算法框架/工具

-编程工程师-

|

博文

开源上新｜FunASR多语言离线文件转写软件包

# 智能语音交互 # 智能语音交互 # 自然语言处理 # 语音技术 # 开发者 # Docker # 容器

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

WhisperChain：开源 AI 实时语音转文字工具！自动消噪优化文本，效率翻倍

WhisperChain 是一款基于 Whisper.cpp 和 LangChain 的开源语音识别工具，能够实时将语音转换为文本，并自动清理和优化文本内容，适用于会议记录、写作辅助等多种场景。

# 智能语音交互 # 智能语音交互 # 人工智能 # API # 语音技术 # iOS开发 # MacOS

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

智能语音交互