语音技术的搜索结果_第18页-阿里云开发者社区

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

WhisperChain：开源 AI 实时语音转文字工具！自动消噪优化文本，效率翻倍

WhisperChain 是一款基于 Whisper.cpp 和 LangChain 的开源语音识别工具，能够实时将语音转换为文本，并自动清理和优化文本内容，适用于会议记录、写作辅助等多种场景。

# 智能语音交互 # 智能语音交互 # 人工智能 # API # 语音技术 # iOS开发 # MacOS

modelscope

|

8月前

|

博文

|

来自： ModelScope模型即服务

HumanOmni：首个专注人类中心场景的多模态大模型，视觉与听觉融合的突破！

HumanOmni是业内首个理解以人为中心的场景，可以同时处理视觉信息、音频信息的多模态大模型。

# 语音技术 # 网络架构 # 开发者

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Baichuan-Audio：端到端音频大模型，实时双语对话+语音生成

Baichuan-Audio 是百川智能推出的端到端音频大语言模型，支持无缝集成音频理解和生成功能，实现高质量、可控的实时中英双语对话。

# 智能语音交互 # 人工智能 # 自然语言处理 # 语音技术

技术小达人

|

8月前

|

博文

一文揭秘｜如何速成RAG+Agent框架大模型应用搭建（一）

一文揭秘｜如何速成RAG+Agent框架大模型应用搭建

# 自然语言处理 # 算法 # API # 语音技术 # 开发工具

技术小达人

|

8月前

|

博文

智能理解 PPT 内容，快速生成讲解视频

# 存储 # 人工智能 # Serverless # 语音技术 # 对象存储

码农小达人

|

9月前

|

博文

王炸组合，阶跃星辰SOTA模型Step-Video和Step-Audio模型开源

# 机器学习/深度学习 # 编解码 # 自然语言处理 # 测试技术 # 语音技术

技术内容小助手

|

9月前

|

博文

和NexaAI一起, 把Qwen2-Audio部署到更多端侧硬件上吧！

# Linux # 测试技术 # 语音技术 # 开发工具 # 文件存储

蚝油菜花

|

9月前

|

博文

|

来自： ModelScope模型即服务

video-subtitle-master：开源字幕生成神器！批量生成+AI翻译全自动，5分钟解放双手

video-subtitle-master 是一款开源AI字幕生成工具，支持批量为视频或音频生成字幕，并可将字幕翻译成多种语言。它集成了多种翻译服务和语音识别技术，适合视频创作者、教育领域和个人娱乐使用。

# 机器翻译 # 机器学习/深度学习 # 人工智能 # JavaScript # API # 语音技术

探索云世界动手实践

|

9月前

|

博文

基于阿里云人工智能平台的智能客服系统开发与部署

随着人工智能技术的发展，智能客服系统成为企业提升服务效率和用户体验的重要工具。阿里云提供包括自然语言处理（NLP）、语音识别（ASR）、机器学习（PAI）等在内的完整AI平台，助力企业快速构建智能客服系统。本文将通过电商平台案例，展示如何基于阿里云AI平台从零开始开发、部署智能客服系统，并介绍其核心优势与最佳实践，涵盖文本和语音客服、知识库管理及数据分析等功能，显著提升客户服务效率和用户满意度。

# 人工智能 # 自然语言处理 # BI # API # 语音技术

技术内容小助手

|

9月前

|

博文

零基础上手百炼语音AI模型｜Github示例工程介绍

# 人工智能 # Java # 语音技术 # 开发者 # Python

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

语音技术