语音技术的搜索结果_热门_第20页-阿里云开发者社区

TechLead

|

博文

听懂未来：AI语音识别技术的进步与实战

# 自然语言处理 # 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 算法 # 语音技术

霍格沃兹测试开发muller老师

|

博文

人工智能，应该如何测试？（五）ASR 效果测试介绍

ASR是自动语音识别技术，将语音转化为文本，涉及多学科知识。数据收集是关键，包括特定人/非特定人、词汇量大小、发音方式、方言和情感等多种类别，高质量数据成本高。ASR流程包括数据收集、标注、输入算法得到文本输出并评估。常用评估指标有字错率（WER）、字正确率及插入/删除/替换率。数据标注需严格遵循规范，工作量大，而Levenshtein库可用于自动化效果评测。在AI领域，大部分时间投入在数据处理上。

# 智能语音交互 # 智能语音交互 # 人工智能 # 自然语言处理 # 算法 # 数据处理 # 语音技术

源码星辰

|

博文

|

来自：龙蜥操作系统

深度学习之声纹识别

基于深度学习的声纹识别（Speaker Recognition）是一种通过分析和识别人的声音特征来确认身份的技术。

# 机器学习/深度学习 # 存储 # 并行计算 # 安全 # 语音技术

-编程工程师-

|

12月前

|

博文

开源上新｜通义语音处理技术ClearerVoice-Studio

# 机器学习/深度学习 # 算法 # 网络协议 # 语音技术 # 开发者

蚝油菜花

|

11月前

|

博文

|

来自： ModelScope模型即服务

三行代码实现实时语音转文本，支持自动断句和语音唤醒，用 RealtimeSTT 轻松创建高效语音 AI 助手

RealtimeSTT 是一款开源的实时语音转文本库，支持低延迟应用，具备语音活动检测、唤醒词激活等功能，适用于语音助手、实时字幕等场景。

# 智能语音交互 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 语音技术 # 异构计算

须尽欢~~

|

博文

音频基础知识 2

音频基础知识

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 编解码 # 语音技术 # 芯片 # 内存技术

_揽

|

博文

（保姆教程及高级玩法及坑）微信同声传译插件-语音识别

# 智能语音交互 # 智能语音交互 # 小程序 # 前端开发 # JavaScript # 数据处理 # 语音技术

5i77ajz5u7ji6

|

博文

MLLM首篇综述 | 一文全览多模态大模型的前世、今生和未来

# 自然语言处理 # 存储 # 自然语言处理 # 文字识别 # 数据可视化 # 语音技术

1941623231718325

|

博文

构建基于AI的语音合成系统：技术探索与实践

【6月更文挑战第3天】本文探讨了构建基于AI的语音合成系统，包括文本预处理、声学模型、语音生成和后期处理四个步骤。关键技术和挑战涉及分词、词性标注、语调预测、HMM、DNN、RNN模型、波形合成及后期音质优化。实践中，获取高质量语音数据、训练计算资源和系统实时性是主要挑战。随着技术进步，未来语音合成将在多语种、个性化领域有更多应用。

# 语音技术 # 人工智能 # 机器学习/深度学习 # 自然语言处理 # 搜索推荐

modelscope

|

博文

|

来自： ModelScope模型即服务

CosyVoice再升级，可扩展流式语音合成

通义实验室在前期的工作中提出了基于监督离散语音标记的多语言语音合成模型CosyVoice。通过使用两种流行的生成模型：语言模型 (LM) 和流匹配进行渐进式语义解码，CosyVoice 在语音语境学习中实现了较高的韵律自然度、内容一致性和说话人相似性。

# 视频点播 # 自然语言处理 # 语音技术 # 开发工具 # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

语音技术