智能语音交互的搜索结果_热门_第9页-阿里云开发者社区

欲揽西江月

|

11月前

|

博文

探索深度学习中的Transformer模型：原理、优势与应用

# 自然语言处理 # 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 自然语言处理 # 并行计算 # 语音技术 # 计算机视觉

蚝油菜花

|

6月前

|

博文

|

来自： ModelScope模型即服务

覆盖16省方言的老人语音数据集！SeniorTalk：智源研究院开源全球首个超高龄老年人中文语音数据集

SeniorTalk是由智源研究院与南开大学联合推出的全球首个中文超高龄老年人对话语音数据集，包含202位75岁及以上老年人的55.53小时语音数据，涵盖16个省市的不同地域口音。

# 智能语音交互 # 数据采集 # 人工智能 # 数据处理 # 语音技术 # 智能硬件

ShaFaChuang-36210

|

11月前

|

博文

智能语音识别技术的现状与未来发展趋势####

【10月更文挑战第29天】本文深入探讨了智能语音识别技术的发展历程、当前主要技术特点、面临的挑战及未来发展趋势。通过综述国内外最新研究成果，分析了深度学习在语音识别领域的应用现状，并展望了多模态融合、端到端建模等前沿技术的潜在影响。文章还讨论了隐私保护、数据安全等问题对技术发展的影响，以及跨语言、跨文化适应性的研究方向。 ####

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 搜索推荐 # 人机交互 # 语音技术 # 数据安全/隐私保护

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

OSUM：告别ASR单一功能，西工大开源的语音大模型会「读心」！识别+情感分析+年龄预测等8大任务1个模型全搞定

OSUM 是西北工业大学开发的开源语音理解模型，支持语音识别、情感分析、说话者性别分类等多种任务，基于 ASR+X 训练策略，具有高效和泛化能力强的特点。

# 智能语音交互 # 人工智能 # 自然语言处理 # Linux # 语音技术 # 异构计算

算精通

|

博文

MRCP（Media Resource Control Protocol）

MRCP（Media Resource Control Protocol）是一种音视频资源控制协议，用于控制语音识别、语音合成和语音交互等场景中的音视频资源。阿里云语音交互服务（ASR、TTS、Chatbot）支持MRCP协议，您可以使用MRCP协议来控制音视频资源，并实现语音交互的功能。

# 智能语音交互 # 智能语音交互 # Java # API # 语音技术 # 开发工具

马超伟

|

博文

人工智能：通俗易懂理解深度学习与神经网络

# 自然语言处理 # 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 人工智能 # 算法 # 数据挖掘 # 机器人 # PyTorch # TensorFlow # 语音技术 # 算法框架/工具 # 计算机视觉

神秘海盗

|

博文

|

来自：通义大模型

通义语音大模型评测：迈向更自然、更智能的语音交互

随着人工智能技术的迅猛发展，语音识别和自然语言处理领域不断涌现出新的模型和应用。阿里云推出的通义语音大模型，正是在这一背景下应运而生。本文将对通义语音大模型进行详细评测，探讨其技术架构、应用场景、性能表现以及未来发展前景。

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 自然语言处理 # 搜索推荐 # 算法 # 语音技术

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

Kokoro-TTS：超轻量级文本转语音模型，支持生成多种语言和多种语音风格

Kokoro-TTS 是一款轻量级文本转语音模型，支持多语言和多语音风格生成，具备实时处理能力和低资源占用，适用于多种应用场景。

# 智能语音交互 # 人工智能 # 自然语言处理 # 并行计算 # API # 语音技术

技术小达人

|

博文

达摩院FunASR实时语音转写服务软件包发布

# 智能语音交互 # 智能语音交互 # 达摩院 # Java # 大数据 # 语音技术 # 开发者

以山向海

|

博文

人工智能语音转文字（Automatic Speech Recognition, ASR）

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 人工智能 # 边缘计算 # 自然语言处理 # 语音技术

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

智能语音交互