智能语音交互的搜索结果_热门_第18页-阿里云开发者社区

技术小达人

|

博文

达摩院语音AI技术创新全景

过去十年，语音AI从实验室走向应用，语音搜索、交互早已融入日常。本文一览达摩院语音AI技术创新全景，一起体会能听、会说、懂你的语音AI。

# GPU云服务器 # 智能语音交互 # 日志服务 # 自然语言处理 # 智能语音交互 # 机器学习/深度学习 # 人工智能 # 达摩院 # 自然语言处理 # 算法 # 前端开发 # 数据挖掘 # 测试技术 # 语音技术 # 智能硬件

wljslmz

|

博文

什么是语音识别的语音助手？

【4月更文挑战第8天】

# 自然语言处理 # 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 自然语言处理 # 算法 # 语音技术 # 智能硬件

DreamSpark

|

博文

FunAudioLLM与其他语音模型多维度对比简析

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 自然语言处理 # 语音技术

蚝油菜花

|

7月前

|

博文

|

来自： ModelScope模型即服务

Baichuan-Audio：端到端音频大模型，实时双语对话+语音生成

Baichuan-Audio 是百川智能推出的端到端音频大语言模型，支持无缝集成音频理解和生成功能，实现高质量、可控的实时中英双语对话。

# 智能语音交互 # 人工智能 # 自然语言处理 # 语音技术

游客cce3i2bdge2s2

|

问答

|

来自： ModelScope模型即服务

关于 modelscope-funasr 报错的问题。

# 智能语音交互

珲yy少

|

博文

iOS MachineLearning 系列（13）—— 语音与音频相关的AI能力

在语音分析方面，iOS中提供了原生的Speech框架，这个框架可以实时的将语音解析成文本。这个能力非常强大，使用它我们可以实现类似实时翻译的功能。对于非语音的音频，也有一些原生的AI能力可以使用，例如分析语音的类型。SoundAnalysis框架能够识别300多种声音，我们也可以使用自己训练的模型来处理定制化的音频识别需求。

# 智能语音交互 # 云解析DNS # 智能语音交互 # 人工智能 # 算法 # API # 语音技术 # iOS开发

刘悦的技术博客

|

博文

中文语音识别转文字的王者,阿里达摩院FunAsr足可与Whisper相颉顽

君不言语音识别技术则已，言则必称Whisper，没错，OpenAi开源的Whisper确实是世界主流语音识别技术的魁首，但在中文领域，有一个足以和Whisper相颉顽的项目，那就是阿里达摩院自研的FunAsr。 FunAsr主要依托达摩院发布的Paraformer非自回归端到端语音识别模型，它具有高精度、高效率、便捷部署的优点，支持快速构建语音识别服务，最重要的是，FunASR支持标点符号识别、低语音识别、音频-视觉语音识别等功能，也就是说，它不仅可以实现语音转写，还能在转写后进行标注，一石二鸟。

# 智能语音交互 # 智能语音交互 # 人工智能 # 达摩院 # 并行计算 # 语音技术 # C++

郑小健

|

博文

FunAudioLLM 技术评测报告

【7月更文第31天】随着人工智能技术的迅速发展，语音识别和语音合成技术已经成为日常生活中不可或缺的一部分。FunAudioLLM 作为一款开源的语音大模型，致力于提供高质量的语音服务，支持多种应用场景。本次评测将重点评估 FunAudioLLM 在性能、功能及技术先进性方面的能力，并将其与国际知名的大规模语音模型进行比较。

# 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 自然语言处理 # Ubuntu # 语音技术 # 智能硬件

邹荣乐

|

博文

前端开发实战：利用Web Speech API之speechSynthesis实现文字转语音功能

# 智能语音交互 # 智能语音交互 # 移动开发 # 前端开发 # JavaScript # API # 语音技术

源码星辰

|

博文

|

来自：龙蜥操作系统

机器学习和深度学习之间的区别

机器学习和深度学习在实际应用中各有优势和局限性。机器学习适用于一些数据量较小、问题相对简单、对模型解释性要求较高的场景；而深度学习则在处理大规模、复杂的数据和任务时表现出色，但需要更多的计算资源和数据，并且模型的解释性较差。在实际应用中，需要根据具体的问题和需求，结合两者的优势，选择合适的方法来解决问题。

# 自然语言处理 # 智能语音交互 # 智能语音交互 # 机器学习/深度学习 # 自然语言处理 # 算法 # 语音技术 # 计算机视觉

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

智能语音交互