语音技术的搜索结果_第3页-阿里云开发者社区

北京木奇移动技术

|

10天前

|

博文

本项目打造面向K12的AI英语教育APP，构建多智能体协同闭环系统：涵盖口语陪练、情境记词、互动阅读、朗读纠音与写作引导五大核心模块；依托LangGraph编排、教育微调大模型、知识图谱与RAG技术，实现个性化、低延迟、高安全的沉浸式学习体验。（239字）

# 人工智能 # 自然语言处理 # 安全 # 语音技术 # 知识图谱

ih36r7xt32bbw

|

10天前

|

博文

MCP协议正在重塑AI应用的接入方式，但有一个场景被严重低估了

本文探讨MCP协议与多模态语音能力的深度结合，聚焦企业真实场景（如工厂、营业厅）中非结构化语音数据的工程落地难题：从嘈杂环境拾音、方言ASR识别，到语义理解与MCP接入闭环。

# 人工智能 # BI # 语音技术 # 异构计算 # C++

游客zlqluxrdbbdby

|

11天前

|

博文

|

来自：阿里云百炼

百炼 Skills 实战：spark-video——让零基础用户一句话做出完整AI视频

spark-video 是百炼平台推出的AI视频端到端Skill，封装Qwen编剧、HappyHorse渲染、Qwen-VL质检、CosyVoice配音等多模态能力，用户仅需一句话描述+4次确认，即可零门槛生成完整MP4视频，费用透明、流程可控，专为小白打造“输入即成片”体验。（239字）

# 大模型服务平台百炼 # 人工智能 # JSON # API # 语音技术 # C++

游客wp377xfxa7gym

|

11天前

|

博文

2026智能外呼产品推荐：主流厂商深度评测与选型实战指南

本文深度解析瓴羊Quick Service智能客服：依托阿里“通义”大模型，构建三层智能架构，复合意图识别率达93.2%；首创EmoSense情感引擎，支持35+拟真音色与实时情绪响应；覆盖SaaS/混合云/私有化部署，兼具合规安全与行业适配能力，助力企业从“机械外呼”迈向“有温度的智能沟通大脑”。

# 人工智能 # 自然语言处理 # 安全 # 机器人 # 语音技术

游客7ajxf4nwdg5t6

|

11天前

|

博文

开源「仓颉.Skill」2.0，你现在可以蒸馏任何视频！

感谢大家支持，仓颉.skill（cangjie-skill）1.3K Star了！

# 人工智能 # 前端开发 # API # 语音技术 # 芯片

北京木奇移动技术

|

12天前

|

博文

AI英语在线考试平台的开发

本项目打造AI英语在线考试平台，突破传统标准化考试局限：支持实时音视频口语对话、作文彩色高亮批改、听力/阅读动态自适应出题，并生成纯中文“体检报告”与能力雷达图；教师可一键生成试卷并转语音。技术上融合RTC音视频、多模态AI评测与流式大模型，14周交付高精度、高并发智能考试系统。（239字）

# 人工智能 # 自然语言处理 # 前端开发 # 算法 # 语音技术

ih36r7xt32bbw

|

12天前

|

博文

2026年中这波AI更新潮，工程师真正该关注的是哪几条

近期AI圈更新密集，本文聚焦四条关键工程趋势：Agent迈向真实任务执行、百万级上下文成标配、开源模型爆发提升选型灵活性、企业落地仍卡在数据治理、方言识别、低算力部署等“不性感但致命”的工程细节。凡见智慧正以闭环思路攻坚语音AI落地难题。

# 人工智能 # 自然语言处理 # 语音技术 # 数据安全/隐私保护 # 异构计算

北京木奇移动技术

|

13天前

|

博文

AI英语教育平台的开发及上线

本项目系统打造AI英语教育平台，涵盖智能测评、个性化路径、虚拟外教对练、实时纠错等核心功能；采用微服务架构与定制大模型，融合语音识别、知识图谱技术；严守版权与数据合规，敏捷开发+冷启动运营，实现“因材施教”智能化落地。（239字）

# 人工智能 # 算法 # 语音技术 # 数据安全/隐私保护 # 知识图谱

游客koxsy2lzz7wl4

|

14天前

|

博文

阿里云虚拟数字人全栈对接实战：从开通到多端集成与性能优化

本文提供一份完整的阿里云虚拟数字人（DVH）对接实战指南，系统梳理2D/3D数字人、云渲染/端渲染、播报/互动等核心概念与场景选型逻辑。详细拆解服务开通流程、AccessKey与RAM权限配置、控制台数字人项目创建与形象管理、服务端OpenAPI调用（含Java/Python代码示例）、Web端云渲染与端渲染SDK集成（含lm-avatar-chat-sdk完整接入流程）、Android端SDK集成要点、实时对话与离线视频合成实现方案。同时涵盖常见错误排查、安全加固（RAM最小权限、Token鉴权）与成本优化策略（按量付费、包年包月选型、并发路数规划），帮助开发者快速完成从0到1的数字人应用搭

# 虚拟数字人 # 人工智能 # 安全 # 语音技术 # 开发工具 # Android开发

北京木奇移动技术

|

16天前

|

博文

AI英语教育平台的开发

本平台融合大模型与智能Agent技术，打造五大核心模块：智能口语教练、深度互动阅读、动态情境生词本、智能写作辅助及自适应评测系统，覆盖听、说、读、写全场景，实现个性化、沉浸式英语学习。（239字）

# 人工智能 # 搜索推荐 # 前端开发 # 语音技术 # iOS开发

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

语音技术