阿里云百炼产品月报【2025年10月】

简介: 本月重点:通义千问发布9款Qwen3-VL多模态新模型,覆盖32B至8B多种尺寸,支持思考模式、超长视频理解及2D/3D定位,并推出统一多模态向量与高精度语音识别模型。MCP生态新增17个云服务,电商AI应用模板上线,支持一键生成商品图与宠物店数字人视频,助力高效内容创作。

image@1x (2).jpg

🌟 本月重点速览

三大引擎齐发:多模态模型矩阵全面升级 × MCP生态极速扩容 × 电商/AI生图应用模板落地。


多模态模型大上新:本月发布 9款Qwen3-VL系列新模型,覆盖32B/30B/8B等多尺寸,支持思考模式、超长视频理解、2D/3D空间定位,并推出统一多模态向量模型 Qwen2.5-VL-Embedding 与 高精度多语种语音识别模型 Qwen3-ASR-Flash-Realtime。
MCP生态再扩容:本月新增17个云部署MCP服务,包括 AIVPP虚拟电厂、通义万相2.5图像视频生成、Vidu AI生视频、VideoCreationTools视频合成工具箱 等,智能体能力边界持续拓展。

成本优化新机制:Qwen-Doc-Turbo、Qwen3-Max等主流模型支持上下文缓存(Cache),命中缓存输入最低享1折优惠,显著降低高频调用成本。

开箱即用应用模板上线:本月上线专为电商卖家设计的应用模板有👉一键生成电商组图、宠物店数字人视频。



一、模型动态

🚀 全新多模态模型矩阵发布

模型名称

类型

核心能力

适用场景

Qwen-Image-Edit-Plus/Plus-2025-10-30

多模态模型

单次请求返回多张图片、缩短响应时间

图片生成、单次生成多张图片

Qwen3-VL-32B-Thinking/Instruct

开源Dense模型

文档理解、空间感知、2D检测、万物识别

复杂视觉感知任务

Qwen3-VL-Flash / Flash-2025-10-15

小尺寸高效模型

融合思考/非思考模式,响应快,支持长视频/长文档

实时交互、边缘部署

Qwen3-VL-30B-A3B 系列

开源MoE模型

强多模态推理 + 2D/3D定位,超长上下文支持

视觉智能体、AR/VR

Qwen3-VL-8B 系列

轻量级模型

低显存占用,保留核心视觉理解能力

移动端、低成本场景

Qwen2.5-VL-Embedding

统一多模态向量

支持文本/图/视频混合输入,输出统一向量

跨模态检索、图搜、视频聚类

Qwen3-ASR-Flash-Realtime

语音识别

自动语种识别,支持11语种,高鲁棒性

会议转录、客服质检、多语种内容生产


🔍 其他重要模型更新

  • Qwen3-Rerank:基于Qwen底座的文本排序模型,支持100+语种与长文本,专为RAG/搜索优化。
  • GLM-4.6:智谱新一代旗舰模型,3550亿总参数,200K上下文,综合能力全面超越GLM-4.5。
  • Cache计费上线
  • Qwen-Doc-Turbo新增Cache计费,在原价的基础上命中缓存的输入享受2折优惠。🔗上下文缓存
  • Qwen3-Max、Qwen-Plus、Qwen-Flash、Qwen3-Coder-Flash 增加显式缓存Cache功能,命中缓存的输入最低可享受1折优惠。🔗上下文缓存

二、产品动态

🌐 MCP市场

本月上架 17个云部署MCP Server,覆盖能源、创意、工具等场景:

  • 一方服务:AIVPP虚拟电厂、通义万相2.5(图像/视频生成)
  • 三方服务:Vidu AI生视频、VideoCreationTools视频合成工具箱
    支持 一键开通、即开即用,快速扩展Agent能力。🔗MCP市场

🎯 应用模板

本月上架2个电商类应用模板,包含一键生成电商组图、宠物店内容营销。更多内容详见🔗应用模板


模板名称

核心功能

用户价值

一键生成电商组图

自动产出商品主图+详情页图组

新品上架效率提升80%,无需设计师

宠物店内容营销

单图+音频 → 个性化宠物数字人视频

营销视频制作从小时级降至分钟级


三、热门活动

🎉实训Agent创客:搭建电商场景Agent

→ 专为电商设计,一键生成电商场景Agent,完成任务有机会领取礼品哦,快来参与吧~


四、精选好文推荐

  1. 《通义Qwen3-Max:大就是好》
    → 深度解析Qwen3-Max在复杂任务中的“涌现能力”。
  2. 《实训Agent创客:一键生成电商场景Agent》
    → 手把手教你用阿里云百炼搭建电商场景Agent。
  3. 《Agent创客「是花子呀」:用Wan2.5打造电商AI生图机器》
    → 真实用户案例:日均生成500+商品图,转化率提升22%。
  4. 【MCP实战】LangChain + Qwen3-Max 构建商品详情页应用
    → 从0到1集成自定义MCP,打造端到端AI应用。
  5. 《阿里云AI基础设施成果入选顶级学术会议》
    → GPU利用率提升40%,支撑千卡级大模型训练。
相关文章
|
12天前
|
人工智能 自然语言处理 安全
阿里云万小智AI建站:基础版、标准版、企业版主要功能及价格对比和选择参考
阿里云万小智 AI 建站是一款基于 AI 驱动的自助建站产品,无需代码基础,通过可视化拖拽与 AI 对话即可快速构建高性能、多语言、安全合规的网站。系统深度集成阿里云 ECS、RDS、OSS、CDN、SLB 与 Web 应用防火墙,保障高可用性、数据安全与全球访问速度。其提供多个版本,精准匹配从个人工作室到中大型企业的差异化需求。
325 167
|
2月前
通义千问Qwen荣获“领先科技奖”
2025年11月6日,通义千问大模型荣膺世界互联网大会“领先科技奖”。凭借卓越性能与开源贡献,其已开源超300个模型,下载量超6亿次,衍生模型超17万,居全球首位。
641 153
|
30天前
|
人工智能 自然语言处理 API
一句话生成拓扑图!AI+Draw.io 封神开源组合,工具让你的效率爆炸
一句话生成拓扑图!next-ai-draw-io 结合 AI 与 Draw.io,通过自然语言秒出架构图,支持私有部署、免费大模型接口,彻底解放生产力,绘图效率直接爆炸。
1206 153
|
1月前
|
机器学习/深度学习 算法
费曼学习法:为什么你应该通过写博客来掌握任何知识
你是否学完就忘?诺贝尔奖得主费曼提出:若无法简单解释,便是未真正理解。其学习法四步——学习、教授、反思、简化——结合写博客,能深度巩固知识。写作倒逼思维清晰,暴露理解盲区,构建个人知识库。无需完美,从“初学者视角”出发,边学边写,用输出驱动输入。写博客不仅是记录,更是成为专家的路径。开始吧,让文字见证你的深度学习之旅。
342 163
费曼学习法:为什么你应该通过写博客来掌握任何知识
|
30天前
|
安全 Linux 测试技术
外网下载内网部署:Yum离线升级Linux软件包
针对生产环境内网隔离、无法直连外网的困境,本文分享利用 `yum install --downloadonly` 命令在外网下载RPM包及依赖,再离线传输至内网部署的完整方案。涵盖单包、批量、指定版本下载,依赖处理与本地安装步骤,实现安全合规的漏洞修复与软件升级,适用于应急响应、批量部署等场景。
327 156
|
2月前
|
SQL 人工智能 运维
速来围观!阿里云百炼本周新鲜事
阿里云百炼是面向企业的大模型开发平台,本周新增2个云部署MCP及6大应用模板,涵盖电商、营销、SQL助手等场景,助力AI高效落地。
350 139
|
2月前
|
人工智能 并行计算 算法
为什么 OpenSearch 向量检索能提速 13 倍?
本文介绍在最新的 OpenSearch 实践中,引入 GPU 并行计算能力 与 NN-Descent 索引构建算法,成功将亿级数据规模下的向量索引构建速度提升至原来的 13 倍。
669 25
为什么 OpenSearch 向量检索能提速 13 倍?
|
2月前
|
人工智能 编解码 数据挖掘
如何给AI一双“懂节奏”的耳朵?
VARSTok 是一种可变帧率语音分词器,能智能感知语音节奏,动态调整 token 长度。它通过时间感知聚类与隐式时长编码,在降低码率的同时提升重建质量,实现高效、自然的语音处理,适配多种应用场景。
197 18
|
30天前
|
存储 人工智能 运维
一行代码实现智能异常检测:UModel PaaS API 架构设计与最佳实践
阿里云 UModel PaaS API 发布:通过 Table + Object 双层抽象,屏蔽存储差异、自动处理字段映射与过滤条件,让每一个实体都成为一个‘可调用的对象’,真正实现‘以实体为中心’的智能可观测。
755 116