阿里云百炼产品月刊【2025年9月】

本文涉及的产品
多模态交互后付费免费试用,全链路、全Agent
简介: 本月通义千问模型大升级,新增多模态、语音、视频生成等高性能模型,支持图文理解、端到端视频生成。官网改版上线全新体验中心,推出高代码应用与智能体多模态知识融合,RAG能力增强,助力企业高效部署AI应用。

image@1x (2).jpg

重点Highlight

  1. 通义模型大上新:模型多模态与推理模型持续上架,支持灵活调用。本月上架并优化了多模态与高性能推理、语音模型。包括文本大模型 qwen-plus-latest 、多模态视觉语言模型 qwen-vl-plus-latest以及Qwen3-TTS-Flash等音频,语音合成等模型,已支持图文理解、视频生成等跨模态任务。实现从文本到视频的端到端生成。
  2. 官网界面大改版:工单、费用、阿里云账号适配发布。文本模型支持H5体验,全新体验中心上线,支持模型直接体验,远程设备控制。操作简便快捷。
  3. 应用能力大换血:工作流模型能力全面升级,提升开发与调试效率。推出高代码应用类型,强化企业级AI服务部署能力。智能体支持多模态知识融合,增强内容理解与交互能力。知识库RAG能力升级。支持结构化数据直连。

1. 产品功能更新

官网产品更新公告可查看🔗产品能力最新动态公告

1.1. 应用供给更新

  • 工作流模型选择节点能力升级:支持灵活配置模型参数,支持实时调试,运行时支持调用Trace链路查看运行过程,支持Dify一键导入,快速适配Dify工作流,Agent市场支持工作流模板。🔗工作流入口

  • 新增新的应用类型:高代码应用。支持基于Python项目结构部署AI后端服务,内置自动化运维、可观测性及日志服务等企业级能力。🔗高代码应用

  • 智能体支持图片、文档、数据多模融合知识索引。🔗智能体入口

  • 知识库数据问答升级:RAG搜索接口升级,文搜、图搜、数搜支持独立服务。数据源管理上线、RAG支持数据库直连,支持私网公网服务。🔗知识库入口

  • MCP广场本月新上架 15个云部署 MCP Server。涵盖一方的Aliyun Supabase、AI订阅付费、PolarDB for PostgreSQL,二方阿里邮箱,三方选股、虎嗅、政策助手等MCP,欢迎直接开通体验。🔗MCP市场

1.2. 其他产品能力

  • 阿里云百炼官网改版升级。工单、费用、阿里云账号适配发布。文本模型支持H5体验,全新体验中心上线,支持模型直接体验,远程设备控制。🔗控制台入口

  • UI设计器全面升级:支持模板配置和快速关联Agent及创建界面。支持企业Agent门户搭建,关联Agent快速构建企业Agent。支持生成类、对话类主流Agent UI界面搭建,风格兼容SparkDesgin。🔗UI设计器入口

2. 模型服务更新

官网模型更新公告可查看🔗模型最新动态公告

2.1. 新模型上架

  1. 全新上线万相2.5系列模型。Wan2.5-I2V-Preview(图生视频)、Wan2.5-T2V-Preview(文生视频)、Wan2.5-T2I-Preview(文生图)、Wan2.5-I2I-Preview(图像编辑)。大幅提升生成能力,提升自然语言理解和指令遵循能力,理解复杂连续变化指令控制,运镜理解,支持结构化提示词,指令遵循能力强。🔗体验入口
  2. 全新上线 Qwen3-Max、Qwen3-Max-2025-09-23、Qwen3-Max-Preview(基于Qwen3的Qwen-Max模型预览版)。相比之前版本,重点提升变编程和智能体能力。中英文通用文本理解能力、复杂指令遵循能力、主观开放任务能力、多语言能力、工具调用能力均显著增强。模型知识幻觉更少。🔗体验入口
  3. 全新上线 Qwen3-VL-Plus、Qwen3-VL-Plus-2025-09-23、Qwen3-VL-235B-A22B-Thinking、Qwen3-VL-235B-A22B-Instruct。此版本在视觉coding、空间感知、多模态思考等方向全面升级;视觉感知与识别能力大幅提升,支持超长视频理解。🔗体验入口
  4. 全新上线端到端语音识别大模型:Fun-ASR-MTL、Fun-ASR-MTL-2025-08-25、Fun-ASR-Realtime、Fun-ASR-Realtime-2025-09-15。具备卓越的上下文感知和高精度语音转写能力。基于端到端架构,Fun-ASR 集成了创新的 RAG 技术,支持大规模热词自定义、敏感/语气词自动过滤、ITN 规范化、标点预测等多维功能,显著提升了整体识别准确率和语境贴合度。 支持中英文自由切换,多地区方言覆盖,具备更强的噪声鲁棒性,适应多样复杂环境。🔗Fun-ASR-MTLAPI调用方式🔗Fun-ASR-RealtimeAPI调用方式
  5. 全新上线 Qwen3-Livetranslate-Flash-Realtime、Qwen3-Livetranslate-Flash-Realtime-2025-09-22。通义千问3-LiveTranslate-Flash的实时版本,一款高精度、高响应、高鲁棒性的多语言实时音视频同传大模型。实现了离线和实时两种音视频翻译能力。🔗API调用方式
  6. 全新上线 Qwen-Image-Plus。参数规模200亿。具备卓越的文本渲染能力,在复杂文本渲染、各类生成与编辑任务中表现出色,模型性能大幅提升。🔗体验入口
  7. 全新上线 Qwen3-Coder-Plus-2025-09-23。该快照版本 Coder 模型和 Qwen Code 系统联合训练,下游任务效果和工具调用鲁棒性提升,大幅提升代码安全性。🔗体验入口
  8. 最新上线Qwen3-Omni系列Flash版本。Qwen3-Omni-Flash、Qwen3-Omni-Flash-Realtime(qwen3-omni-flash的实时版)、Qwen3-Omni-Flash-2025-09-15、Qwen3-Omni-Flash-Realtime-2025-09-15。支持文本、图像、音频、视频的高效理解与语音生成能力,可进行119种语言文本交互和20种语言语音交互。广泛应用于文本创作、语音助手、多媒体分析等场景。开源一款音频细粒度分析模型Qwen3-Omni-30B-A3B-Captione。专为在复杂多变的音频场景中生成精准、全面的内容描述而设计,能够在多声源、混合化的环境中亦保持稳定而可信的输出。🔗Qwen3-Omni-FlashAPI调用方式🔗 Qwen3-Omni-Flash-RealtimeAPI调用方式🔗Qwen3-Omni-30B-A3B-CaptioneAPI调用方式
  9. 最新上线 Qwen3-TTS-Flash-Realtime、Qwen3-TTS-Flash-Realtime-2025-09-18、Qwen3-TTS-Flash,Qwen3-TTS-Flash-2025-09-18。均能低延迟高稳定地合成音频,同时支持多种语言,方言,支持同一音色多语言输出。经过海量数据训练,合成音频可以根据文本自适应调节语气,对复杂文本合成也有较好的处理能力。🔗Qwen3-TTS-Flash体验入口🔗Qwen3-TTS-Flash-RealtimeAPI调用方式
  10. 最新上架 Wan2.2-Animate-Mix(角色替换模型)、Wan2.2-Animate-Move(角色动画生成模型)。只需上传一张角色照片和一段表演视频,即可将表情与动作迁移至照片角色,精准还原场景、光照与色调,生成高保真动画视频。🔗Wan2.2-Animate-Mix API调用🔗Wan2.2-Animate-Move API调用
  11. 新上线Qwen3-Next系列模型 Qwen3-Next-80B-A3B-Instruct、Qwen3-Next-80B-A3B-Thinking。相较上一版本(通义千问3-235B-A22B-Instruct/Thinking-2507)在文本理解、逻辑推理和文本生成等方面均展现出卓越性能,同时具备更高的效率和更低的资源消耗。🔗体验入口
  12. 新上线 Qwen-Plus-2025-09-11 快照版。相较于qwen-plus-2025-07-28,在思考模式下提升了指令遵循能力、总结回复更加精简。在非思考模式下中文理解与逻辑推理能力得到增强。🔗体验入口
  13. 新上线 Qwen3-ASR-Flash、Qwen3-ASR-Flash-2025-09-08 快照版。基于Qwen3-Omni模型基座训练而成,支持多语言识别、歌唱识别、噪声拒识等功能,能将录制好的音频精准地转换为文本。🔗API调用方式
  14. 新上线语音合成 CosyVoice-v3-plus、CosyVoice-v3 模型。较之前版本在自然度、音质、韵律、情感表现力上有更好的表现。支持文本至语音的实时流式合成。增加了更多小语种支持(德、西、法、意、俄)。仅需提供5-20s的参考音频,即可迅速生成高度相似且听感自然的定制声音。(邀测体验)🔗申请入口
  15. 新上线 DeepSeek-V3.2-Exp 模型。混合推理架构模型,同时支持思考模式与非思考模式,引入稀疏注意力机制,旨在提升处理长文本时的训练与推理效率,价格低于 deepseek-v3.1。🔗体验入口

2.2. 模型迭代更新

  • 最新更新 Qwen-Image-Edit Qwen-Image-Edit-2509 版本。对于多图输入提供“人物+人物”,“人物+商品”,“人物+场景” 等多种玩法。 对于单图输入, 显著提高了一致性。🔗体验入口
  • 全新升级 Qwen3-MT 模型,Qwen-MT系列模型模型上下文窗口长度提升至16K,能够提供更丰富的背景信息、调整翻译的风格,获得更精准、可控的翻译体验。🔗体验入口
  • 全新升级 Qwen-VL-OCR-Latest 模型已更新为最新快照版本【通义千问VL-OCR-2025-08-28】。08-28快照版本在文字定位能力、通用文字识别及卡证票据信息抽取能力均有提升,🔗体验入口
  • 阿里云百炼已于2025年9月16日更新升级 Qwen-PlusQwen-Plus-2025-07-28 快照版、Qwen-VL-Max Qwen-VL-Max-2025-08-13 快照版、 Qwen-VL-Plus Qwen-VL-Plus-2025-08-15 快照版。计费同步变更。🔗查看公告🔗查看公告
  • 阿里云百炼将于2025年10月22日更新 Qwen3-Coder-Plus Qwen3-Coder-Plus-2025-09-23 快照模型相较上一版本(7月22日快照)在下游任务效果和工具调用方面鲁棒性有所提升,代码安全性增强。🔗查看公告

3. 最新活动

1️⃣阿里云百炼狂欢购来袭。成为阿里云百炼云大使,一起瓜分90000元现金奖池。🔗活动入口


如果需要进一步了解阿里云百炼的,可直接点击下面链接哦:

👉阿里云百炼详情了解可点击此官网链接:阿里云百炼官网介绍

👉阿里云百炼控制台页面可点击此链接直接进入阿里云百炼控制台

相关文章
|
11天前
|
存储 关系型数据库 分布式数据库
PostgreSQL 18 发布,快来 PolarDB 尝鲜!
PostgreSQL 18 发布,PolarDB for PostgreSQL 全面兼容。新版本支持异步I/O、UUIDv7、虚拟生成列、逻辑复制增强及OAuth认证,显著提升性能与安全。PolarDB-PG 18 支持存算分离架构,融合海量弹性存储与极致计算性能,搭配丰富插件生态,为企业提供高效、稳定、灵活的云数据库解决方案,助力企业数字化转型如虎添翼!
|
9天前
|
存储 人工智能 搜索推荐
终身学习型智能体
当前人工智能前沿研究的一个重要方向:构建能够自主学习、调用工具、积累经验的小型智能体(Agent)。 我们可以称这种系统为“终身学习型智能体”或“自适应认知代理”。它的设计理念就是: 不靠庞大的内置知识取胜,而是依靠高效的推理能力 + 动态获取知识的能力 + 经验积累机制。
347 130
|
9天前
|
存储 人工智能 Java
AI 超级智能体全栈项目阶段二:Prompt 优化技巧与学术分析 AI 应用开发实现上下文联系多轮对话
本文讲解 Prompt 基本概念与 10 个优化技巧,结合学术分析 AI 应用的需求分析、设计方案,介绍 Spring AI 中 ChatClient 及 Advisors 的使用。
433 130
AI 超级智能体全栈项目阶段二:Prompt 优化技巧与学术分析 AI 应用开发实现上下文联系多轮对话
|
3天前
|
存储 安全 前端开发
如何将加密和解密函数应用到实际项目中?
如何将加密和解密函数应用到实际项目中?
201 138
|
9天前
|
人工智能 Java API
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
本文介绍AI大模型的核心概念、分类及开发者学习路径,重点讲解如何选择与接入大模型。项目基于Spring Boot,使用阿里云灵积模型(Qwen-Plus),对比SDK、HTTP、Spring AI和LangChain4j四种接入方式,助力开发者高效构建AI应用。
389 122
AI 超级智能体全栈项目阶段一:AI大模型概述、选型、项目初始化以及基于阿里云灵积模型 Qwen-Plus实现模型接入四种方式(SDK/HTTP/SpringAI/langchain4j)
|
3天前
|
存储 JSON 安全
加密和解密函数的具体实现代码
加密和解密函数的具体实现代码
202 136
|
22天前
|
弹性计算 关系型数据库 微服务
基于 Docker 与 Kubernetes(K3s)的微服务:阿里云生产环境扩容实践
在微服务架构中,如何实现“稳定扩容”与“成本可控”是企业面临的核心挑战。本文结合 Python FastAPI 微服务实战,详解如何基于阿里云基础设施,利用 Docker 封装服务、K3s 实现容器编排,构建生产级微服务架构。内容涵盖容器构建、集群部署、自动扩缩容、可观测性等关键环节,适配阿里云资源特性与服务生态,助力企业打造低成本、高可靠、易扩展的微服务解决方案。
1361 8
|
8天前
|
监控 JavaScript Java
基于大模型技术的反欺诈知识问答系统
随着互联网与金融科技发展,网络欺诈频发,构建高效反欺诈平台成为迫切需求。本文基于Java、Vue.js、Spring Boot与MySQL技术,设计实现集欺诈识别、宣传教育、用户互动于一体的反欺诈系统,提升公众防范意识,助力企业合规与用户权益保护。

热门文章

最新文章