阿里云百炼产品月报【2025年10月】

简介: 本月重点:通义千问发布9款Qwen3-VL多模态新模型,覆盖32B至8B多种尺寸,支持思考模式、超长视频理解及2D/3D定位,并推出统一多模态向量与高精度语音识别模型。MCP生态新增17个云服务,电商AI应用模板上线,支持一键生成商品图与宠物店数字人视频,助力高效内容创作。

image@1x (2).jpg

🌟 本月重点速览

三大引擎齐发:多模态模型矩阵全面升级 × MCP生态极速扩容 × 电商/AI生图应用模板落地。


多模态模型大上新:本月发布 9款Qwen3-VL系列新模型,覆盖32B/30B/8B等多尺寸,支持思考模式、超长视频理解、2D/3D空间定位,并推出统一多模态向量模型 Qwen2.5-VL-Embedding 与 高精度多语种语音识别模型 Qwen3-ASR-Flash-Realtime。
MCP生态再扩容:本月新增17个云部署MCP服务,包括 AIVPP虚拟电厂、通义万相2.5图像视频生成、Vidu AI生视频、VideoCreationTools视频合成工具箱 等,智能体能力边界持续拓展。

成本优化新机制:Qwen-Doc-Turbo、Qwen3-Max等主流模型支持上下文缓存(Cache),命中缓存输入最低享1折优惠,显著降低高频调用成本。

开箱即用应用模板上线:本月上线专为电商卖家设计的应用模板有👉一键生成电商组图、宠物店数字人视频。



一、模型动态

🚀 全新多模态模型矩阵发布

模型名称

类型

核心能力

适用场景

Qwen-Image-Edit-Plus/Plus-2025-10-30

多模态模型

单次请求返回多张图片、缩短响应时间

图片生成、单次生成多张图片

Qwen3-VL-32B-Thinking/Instruct

开源Dense模型

文档理解、空间感知、2D检测、万物识别

复杂视觉感知任务

Qwen3-VL-Flash / Flash-2025-10-15

小尺寸高效模型

融合思考/非思考模式,响应快,支持长视频/长文档

实时交互、边缘部署

Qwen3-VL-30B-A3B 系列

开源MoE模型

强多模态推理 + 2D/3D定位,超长上下文支持

视觉智能体、AR/VR

Qwen3-VL-8B 系列

轻量级模型

低显存占用,保留核心视觉理解能力

移动端、低成本场景

Qwen2.5-VL-Embedding

统一多模态向量

支持文本/图/视频混合输入,输出统一向量

跨模态检索、图搜、视频聚类

Qwen3-ASR-Flash-Realtime

语音识别

自动语种识别,支持11语种,高鲁棒性

会议转录、客服质检、多语种内容生产


🔍 其他重要模型更新

  • Qwen3-Rerank:基于Qwen底座的文本排序模型,支持100+语种与长文本,专为RAG/搜索优化。
  • GLM-4.6:智谱新一代旗舰模型,3550亿总参数,200K上下文,综合能力全面超越GLM-4.5。
  • Cache计费上线
  • Qwen-Doc-Turbo新增Cache计费,在原价的基础上命中缓存的输入享受2折优惠。🔗上下文缓存
  • Qwen3-Max、Qwen-Plus、Qwen-Flash、Qwen3-Coder-Flash 增加显式缓存Cache功能,命中缓存的输入最低可享受1折优惠。🔗上下文缓存

二、产品动态

🌐 MCP市场

本月上架 17个云部署MCP Server,覆盖能源、创意、工具等场景:

  • 一方服务:AIVPP虚拟电厂、通义万相2.5(图像/视频生成)
  • 三方服务:Vidu AI生视频、VideoCreationTools视频合成工具箱
    支持 一键开通、即开即用,快速扩展Agent能力。🔗MCP市场

🎯 应用模板

本月上架2个电商类应用模板,包含一键生成电商组图、宠物店内容营销。更多内容详见🔗应用模板


模板名称

核心功能

用户价值

一键生成电商组图

自动产出商品主图+详情页图组

新品上架效率提升80%,无需设计师

宠物店内容营销

单图+音频 → 个性化宠物数字人视频

营销视频制作从小时级降至分钟级


三、热门活动

🎉实训Agent创客:搭建电商场景Agent

→ 专为电商设计,一键生成电商场景Agent,完成任务有机会领取礼品哦,快来参与吧~


四、精选好文推荐

  1. 《通义Qwen3-Max:大就是好》
    → 深度解析Qwen3-Max在复杂任务中的“涌现能力”。
  2. 《实训Agent创客:一键生成电商场景Agent》
    → 手把手教你用阿里云百炼搭建电商场景Agent。
  3. 《Agent创客「是花子呀」:用Wan2.5打造电商AI生图机器》
    → 真实用户案例:日均生成500+商品图,转化率提升22%。
  4. 【MCP实战】LangChain + Qwen3-Max 构建商品详情页应用
    → 从0到1集成自定义MCP,打造端到端AI应用。
  5. 《阿里云AI基础设施成果入选顶级学术会议》
    → GPU利用率提升40%,支撑千卡级大模型训练。
相关文章
|
人工智能 移动开发 自然语言处理
阿里云百炼产品月刊【2025年9月】
本月通义千问模型大升级,新增多模态、语音、视频生成等高性能模型,支持图文理解、端到端视频生成。官网改版上线全新体验中心,推出高代码应用与智能体多模态知识融合,RAG能力增强,助力企业高效部署AI应用。
1496 0
|
4月前
|
人工智能 编解码 数据挖掘
如何给AI一双“懂节奏”的耳朵?
VARSTok 是一种可变帧率语音分词器,能智能感知语音节奏,动态调整 token 长度。它通过时间感知聚类与隐式时长编码,在降低码率的同时提升重建质量,实现高效、自然的语音处理,适配多种应用场景。
291 18
|
4月前
|
人工智能 并行计算 算法
为什么 OpenSearch 向量检索能提速 13 倍?
本文介绍在最新的 OpenSearch 实践中,引入 GPU 并行计算能力 与 NN-Descent 索引构建算法,成功将亿级数据规模下的向量索引构建速度提升至原来的 13 倍。
791 25
为什么 OpenSearch 向量检索能提速 13 倍?
|
人工智能 自然语言处理 大数据
阿里云百炼,带你搭建外贸图片翻译助手智能体 从阿里云OpenAPI导入机器翻译API,实现OpenAPI自定义MCP
阿里云提供一站式内容本地化解决方案,涵盖图文视频多模态翻译。通过机器翻译、图片诊断、标题优化等API,助力跨境电商高效实现商品信息多语言智能转换与优化,降低人工成本,提升出海效率。
618 0
|
3月前
|
SQL 人工智能 缓存
阿里云百炼产品月刊【2025年11月】
通义千问本月重磅升级:上线10款多模态与语音模型,涵盖ASR、TTS、视觉语言及翻译;MCP市场新增3个云服务,上架24个电商应用模板;推出实训Agent创客活动,助力高效生成电商视觉内容。
915 10
|
2月前
|
消息中间件 人工智能 自然语言处理
阿里云百炼产品月报【2025年12月】
阿里云百炼重磅升级:支持多模态文件上传与智能解析,MCP体验优化并新增12个云部署服务,知识库交互重构,上线146个应用模板及24款新模型,全面赋能AI应用开发。
716 3
|
5月前
|
人工智能
实训Agent创客:一键生成电商场景Agent
在阿里云百炼一键生成电商场景Agent,轻松帮您搞定商品展示图片、视频。快来参与活动任务吧!
697 2
|
3月前
|
存储 人工智能 运维
一行代码实现智能异常检测:UModel PaaS API 架构设计与最佳实践
阿里云 UModel PaaS API 发布:通过 Table + Object 双层抽象,屏蔽存储差异、自动处理字段映射与过滤条件,让每一个实体都成为一个‘可调用的对象’,真正实现‘以实体为中心’的智能可观测。
920 144
|
4月前
|
人工智能 缓存 搜索推荐
阿里云百炼产品月报【2025年10月】
通义千问本月重磅升级:发布9款Qwen3-VL多模态模型,支持视频理解、2D/3D定位;MCP生态新增17项服务;推出电商AI生图模板,助力商家降本增效。

热门文章

最新文章