阿里云百炼产品月刊【2025年9月】
本月通义千问模型大升级,新增多模态、语音、视频生成等高性能模型,支持图文理解、端到端视频生成。官网改版上线全新体验中心,推出高代码应用与智能体多模态知识融合,RAG能力增强,助力企业高效部署AI应用。
22_注意力机制详解:从基础到2025年最新进展
在深度学习的发展历程中,注意力机制(Attention Mechanism)扮演着越来越重要的角色,特别是在自然语言处理(NLP)、计算机视觉(CV)和语音识别等领域。注意力机制的核心思想是模拟人类视觉系统的聚焦能力,让模型能够在处理复杂数据时,选择性地关注输入的不同部分,从而提高模型的性能和可解释性。
让每次语音唤醒都可靠,公牛沐光重构可观测体系
本文详细介绍了公牛沐光团队如何从开源监控方案 SkyWalking 成功迁移到阿里云 ARMS,构建起一套集观测、追踪、日志分析与智能告警于一体的全栈式可观测平台的实践历程。文章不仅揭示了技术选型的关键考量维度,更重点呈现了 ARMS 在大模型与 IoT 融合场景中的独特价值——从语音识别瓶颈定位、大模型推理性能优化到语音合成质量保障,实现了从"被动响应"到"主动治理"的转型。
你们催更的模型,云栖大会一口气全发了!
通义发布6款全新模型及“通义百聆”语音品牌,覆盖文本、视觉、语音、视频、代码、图像全场景。Qwen系列升级显著提升多模态理解与生成能力,Wan2.5支持音画同步,百聆攻克企业语音落地难题,全面赋能AI应用创新。