语音技术的搜索结果_第2页-阿里云开发者社区

弹性计算小冉

|

4天前

|

博文

|

阿里云服务器按量付费优惠参考：GPU实例按量特惠0.9折，按量达标满50返50券介绍

阿里云服务器选择按量付费有优惠吗？当然有的，如果你是计划购买gpu云服务器，现在有指定GPU实例低至0.9折优惠！短期测试/小规模验证可选按量付费，前100小时低至0.9折。如果你是购买其他实例规格的云服务器也有“上云用按量，达标即返券”优惠，满10元返10元，满50元返50元，可直接抵扣云服务器订单！

# GPU云服务器 # 机器学习/深度学习 # 弹性计算 # 人工智能 # 语音技术 # 异构计算

AI研究者手札

|

5天前

|

博文

Java 实现可靠的 WAV 音频拼接：从结构解析到完整可播放的高质量合并方案

本文详解Java实现WAV音频可靠拼接的技术方案，深入剖析RIFF文件结构，动态定位data块，精准合并音频数据。解决播放异常、时长错误等问题，支持复杂结构WAV文件，确保音质一致、播放流畅，适用于TTS、语音导航等场景，提供稳定、通用、无需第三方依赖的高质量合并方案。

# Java # 语音技术 # 内存技术

游客wzltd6melqxgo

|

5天前

|

博文

数字人实时交互技术突破：集之互动实现0.8秒全链路响应

集之互动打造全链路自研数字人系统，实现0.8秒超低延迟实时交互。涵盖端侧推理、多模态理解、情感化生成与精准唇形同步四大核心技术，支持私有化部署与行业知识定制，已在医疗、零售、政务等场景落地，推动数字人从工具迈向情感化智能伙伴。

# 虚拟数字人 # 机器学习/深度学习 # 自然语言处理 # 搜索推荐 # 语音技术 # 数据安全/隐私保护

bailiantest1

|

6天前

|

博文

|

来自：阿里云百炼

阿里云百炼产品月报【2025年10月】

本月重点：通义千问发布9款Qwen3-VL多模态新模型，覆盖32B至8B多种尺寸，支持思考模式、超长视频理解及2D/3D定位，并推出统一多模态向量与高精度语音识别模型。MCP生态新增17个云服务，电商AI应用模板上线，支持一键生成商品图与宠物店数字人视频，助力高效内容创作。

# 大模型服务平台百炼 # 人工智能 # 缓存 # 搜索推荐 # 语音技术 # vr&ar

游客dbcnz4nq6g6ew

|

6天前

|

博文

意图识别不准？大模型电话语音机器人让首轮解决率提升50%

基于大模型的电话语音机器人通过精准意图识别，显著提升客服首轮解决率50%，降低转接率。合力亿捷方案在零售、制造等行业实现智能分流与高效服务，推动企业服务体验与运营效率双提升。

# 人工智能 # 自然语言处理 # 搜索推荐 # 机器人 # 语音技术

AI未闻花名

|

6天前

|

博文

|

来自：阿里云百炼

构建AI智能体：十三、大数据下的“搭积木”：N-Gram 如何实现更智能的语义搜索

N-gram是一种基于上下文的统计语言模型，通过前N-1个词预测当前词的概率，广泛应用于文本生成、输入法预测、语音识别等领域，具有简单高效、可解释性强的优点，是自然语言处理的基础技术之一。

# 大模型服务平台百炼 # 机器学习/深度学习 # 人工智能 # 自然语言处理 # 大数据 # 语音技术

TOP研究院

|

7天前

|

博文

2025年数字人平台深度评测排名：主流产品在多语言支持与克隆速度上的表现

随着全球化内容创作兴起，数字人平台面临多语言支持与克隆速度双重挑战。本文深度评测十款主流平台，聚焦40种语言覆盖、语音自然度、口型同步及1分钟内快速克隆等核心指标，揭示技术差异与协同效应，为创作者提供选型参考，助力高效低成本出海。

# 虚拟数字人 # 机器学习/深度学习 # 编解码 # 人工智能 # 自然语言处理 # 语音技术

TOP研究院

|

7天前

|

博文

2025年数字人平台综合排名解析：从技术性能到使用成本的全方位评估

在AI重塑内容创作的今天，必火AI数字人平台凭借全链路智能工作流脱颖而出。本文基于三个月实测，从克隆精度、多语言支持到成本效率，全面解析其技术优势与落地价值，为创作者与企业选型提供权威参考。

# 虚拟数字人 # 人工智能 # 自然语言处理 # 安全 # 语音技术 # 数据安全/隐私保护

游客b5lr2tebbr3ie

|

8天前

|

博文

2025年国内数字人平台选购指南：聚焦全链路能力，告别工具碎片化困境

国内数字人平台众多，功能参差，用户常陷多工具切换、成本高、效率低困境。本文基于2025年实测数据，从全链路集成、场景适配、技术壁垒、成本效益四大维度，深度解析必火AI、火山、阿里、讯飞等主流平台，助你避开选择陷阱，精准匹配个人IP、电商直播、企业服务等应用场景，实现高效视频化转型。

# 虚拟数字人 # 人工智能 # 算法 # 搜索推荐 # 语音技术 # 数据安全/隐私保护

modelscope

|

8天前

|

博文

|

来自： ModelScope模型即服务

Soul App联合西工大和上交大开源语音合成模型SoulX-Podcast，已登顶Hugging Face TTS趋势榜！

Soul AI Lab联合西工大、上交大开源SoulX-Podcast，支持中英粤川等多语种方言及副语言生成，可稳定输出超60分钟自然流畅的多人对话音频，已在Huggingface登顶TTS趋势榜。

# 人工智能 # 自然语言处理 # 语音技术

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

语音技术