语音技术的搜索结果_文章_第14页-阿里云开发者社区

nefelibata

|

7月前

|

博文

合力亿捷云客服系统：2025年大模型如何重塑全渠道对话体验

2025年，以DeepSeek等大模型为核心的智能客服系统，突破传统效率瓶颈，通过全渠道整合、多模态交互、个性化服务与情感智能，重构企业客户互动模式。从机械应答到认知共情，从单一文本到多维交互，大模型赋能客服系统成为企业价值创造的战略资产，推动客户服务迈向智能化新纪元。

# 客服工作台 # 自然语言处理 # 搜索推荐 # 机器人 # 数据挖掘 # 语音技术

modelscope

|

7月前

|

博文

|

来自： ModelScope模型即服务

重磅发布｜支持东方40语种+中国22方言的新SOTA语音大模型Dolphin开源啦！

在当今数字化时代，语音识别技术已成为人机交互的关键桥梁，广泛应用于智能客服、语音助手、会议转录等众多领域。

# 机器学习/深度学习 # 自然语言处理 # 人机交互 # 语音技术 # 开发者

游客a4oswvtctqbx6

|

7月前

|

博文

推动人工智能技术和产业变革，啥是核心驱动力？生成式人工智能认证（GAI认证）揭秘答案

人工智能（AI）正以前所未有的速度重塑世界，其发展离不开领军人才与创新生态的支持。文章探讨了AI领军人才的核心特质及培养路径，强调构建产学研深度融合的创新生态，并通过教育变革与GAI认证提升全民AI素养，为技术与产业变革提供持续动力。这不仅是推动社会高质量发展的关键，也为个人与企业带来了更多机遇。

# 人工智能 # 语音技术

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

PaddleSpeech：百度飞桨开源语音处理神器，识别合成翻译全搞定

PaddleSpeech是百度飞桨团队推出的开源语音处理工具包，集成语音识别、合成、翻译等核心技术，基于PaddlePaddle框架提供高性能解决方案。

# 智能语音交互 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 语音技术 # 异构计算

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

EmotiVoice：网易开源AI语音合成黑科技，2000+音色情感可控

EmotiVoice是网易有道开源的多语言语音合成系统，支持中英文2000多种音色，通过提示词控制情感输出，提供Web界面和API接口，具备语音克隆等先进功能。

# 智能语音交互 # 人工智能 # API # 语音技术 # Docker # 容器

modelscope

|

8月前

|

博文

|

来自： ModelScope模型即服务

看听说写四维突破：Qwen2.5-Omni 端到端多模态模型开源！

今天，通义千问团队发布了 Qwen2.5-Omni，Qwen 模型家族中新一代端到端多模态旗舰模型。该模型专为全方位多模态感知设计，能够无缝处理文本、图像、音频和视频等多种输入形式，并通过实时流式响应同时生成文本与自然语音合成输出。

# 文字识别 # 测试技术 # 语音技术 # Docker # 容器

1918010837065910

|

8月前

|

博文

HarmonyOS NEXT AI基础语音服务-语音输入

本案例展示了一个基于AI语音服务的实时语音转文字功能，通过麦克风采集音频并转换为文本。主要步骤包括：申请麦克风权限、初始化语音识别引擎、设置识别回调、配置音频参数及实现UI交互（长按按钮控制录音启停）。代码使用TypeScript编写，涵盖权限管理、引擎生命周期、异常处理等核心环节，确保功能稳定运行。适用于需要实时语音转写的场景，如会议记录、语音输入等。

# 语音服务 # 人工智能 # JavaScript # 语音技术 # 数据安全/隐私保护 # UED

1918010837065910

|

8月前

|

博文

HarmonyOS NEXT AI基础语音服务-文章播报

这是一篇关于基于AI文字转语音（TTS）服务的案例解析，展示了如何通过 `textToSpeech` 模块实现语音播报功能。代码中定义了一个名为 `CoreSpeechKit` 的组件，包含文本内容、TTS引擎初始化、播放控制及界面构建等功能。核心步骤包括引入必要模块、定义组件生命周期方法（如 `aboutToAppear` 和 `aboutToDisappear`）、设置播放逻辑以及构建UI界面。此案例适用于学习文字转语音技术的实际应用与开发流程。

# 语音服务 # 存储 # 人工智能 # 语音技术

蚝油菜花

|

8月前

|

博文

|

来自： ModelScope模型即服务

Video-T1：视频生成实时手术刀！清华腾讯「帧树算法」终结闪烁抖动

清华大学与腾讯联合推出的Video-T1技术，通过测试时扩展（TTS）和Tree-of-Frames方法，显著提升视频生成的连贯性与文本匹配度，为影视制作、游戏开发等领域带来突破性解决方案。

# 视觉智能开放平台 # 人工智能 # 算法 # 语音技术 # 异构计算

游客a4oswvtctqbx6

|

8月前

|

博文

生成式AI掀起职业革命：哪些工作的门槛越来越低？与生成式人工智能（GAI）认证的兴起

本文探讨生成式AI如何改变职场生态，降低内容创作、数据分析和客户服务等领域的专业门槛，并分析GAI认证的兴起与意义。生成式AI通过自然语言处理、图像生成等技术提升效率，而GAI认证则为企业和个人提供技能标准，助力职业发展。两者结合将塑造未来职场新生态，推动社会进步与技术创新。

# 人工智能 # 自然语言处理 # 搜索推荐 # 数据挖掘 # 语音技术

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

语音技术