阿里云百炼产品月刊【2025年9月】

本文涉及的产品
多模态交互后付费免费试用,全链路、全Agent
简介: 本月通义千问模型大升级,新增多模态、语音、视频生成等高性能模型,支持图文理解、端到端视频生成。官网改版上线全新体验中心,推出高代码应用与智能体多模态知识融合,RAG能力增强,助力企业高效部署AI应用。

image@1x (2).jpg

重点Highlight

  1. 通义模型大上新:模型多模态与推理模型持续上架,支持灵活调用。本月上架并优化了多模态与高性能推理、语音模型。包括文本大模型 qwen-plus-latest 、多模态视觉语言模型 qwen-vl-plus-latest以及Qwen3-TTS-Flash等音频,语音合成等模型,已支持图文理解、视频生成等跨模态任务。实现从文本到视频的端到端生成。
  2. 官网界面大改版:工单、费用、阿里云账号适配发布。文本模型支持H5体验,全新体验中心上线,支持模型直接体验,远程设备控制。操作简便快捷。
  3. 应用能力大换血:工作流模型能力全面升级,提升开发与调试效率。推出高代码应用类型,强化企业级AI服务部署能力。智能体支持多模态知识融合,增强内容理解与交互能力。知识库RAG能力升级。支持结构化数据直连。

1. 产品功能更新

1.1. 应用供给更新

  • 工作流模型选择节点能力升级:支持灵活配置模型参数,支持实时调试,运行时支持调用Trace链路查看运行过程,支持Dify一键导入,快速适配Dify工作流,Agent市场支持工作流模板。🔗工作流入口

  • 新增新的应用类型:高代码应用。支持基于Python项目结构部署AI后端服务,内置自动化运维、可观测性及日志服务等企业级能力。🔗高代码应用

  • 智能体支持图片、文档、数据多模融合知识索引。🔗智能体入口

  • 知识库数据问答升级:RAG搜索接口升级,文搜、图搜、数搜支持独立服务。数据源管理上线、RAG支持数据库直连,支持私网公网服务。🔗知识库入口

  • MCP广场本月新上架 15个云部署 MCP Server。涵盖一方的Aliyun Supabase、AI订阅付费、PolarDB for PostgreSQL,二方阿里邮箱,三方选股、虎嗅、政策助手等MCP,欢迎直接开通体验。🔗MCP市场

1.2. 其他产品能力

  • 阿里云百炼官网改版升级。工单、费用、阿里云账号适配发布。文本模型支持H5体验,全新体验中心上线,支持模型直接体验,远程设备控制。🔗控制台入口

  • UI设计器全面升级:支持模板配置和快速关联Agent及创建界面。支持企业Agent门户搭建,关联Agent快速构建企业Agent。支持生成类、对话类主流Agent UI界面搭建,风格兼容SparkDesgin。🔗UI设计器入口

2. 模型服务更新

官网模型更新公告可查看🔗模型最新动态公告

2.1. 新模型上架

  1. 全新上线万相2.5系列模型。Wan2.5-I2V-Preview(图生视频)、Wan2.5-T2V-Preview(文生视频)、Wan2.5-T2I-Preview(文生图)、Wan2.5-I2I-Preview(图像编辑)。大幅提升生成能力,提升自然语言理解和指令遵循能力,理解复杂连续变化指令控制,运镜理解,支持结构化提示词,指令遵循能力强。🔗体验入口
  2. 全新上线 Qwen3-Max、Qwen3-Max-2025-09-23、Qwen3-Max-Preview(基于Qwen3的Qwen-Max模型预览版)。相比之前版本,重点提升变编程和智能体能力。中英文通用文本理解能力、复杂指令遵循能力、主观开放任务能力、多语言能力、工具调用能力均显著增强。模型知识幻觉更少。🔗体验入口
  3. 全新上线 Qwen3-VL-Plus、Qwen3-VL-Plus-2025-09-23、Qwen3-VL-235B-A22B-Thinking、Qwen3-VL-235B-A22B-Instruct。此版本在视觉coding、空间感知、多模态思考等方向全面升级;视觉感知与识别能力大幅提升,支持超长视频理解。🔗体验入口
  4. 全新上线端到端语音识别大模型:Fun-ASR-MTL、Fun-ASR-MTL-2025-08-25、Fun-ASR-Realtime、Fun-ASR-Realtime-2025-09-15。具备卓越的上下文感知和高精度语音转写能力。基于端到端架构,Fun-ASR 集成了创新的 RAG 技术,支持大规模热词自定义、敏感/语气词自动过滤、ITN 规范化、标点预测等多维功能,显著提升了整体识别准确率和语境贴合度。 支持中英文自由切换,多地区方言覆盖,具备更强的噪声鲁棒性,适应多样复杂环境。🔗Fun-ASR-MTLAPI调用方式🔗Fun-ASR-RealtimeAPI调用方式
  5. 全新上线 Qwen3-Livetranslate-Flash-Realtime、Qwen3-Livetranslate-Flash-Realtime-2025-09-22。通义千问3-LiveTranslate-Flash的实时版本,一款高精度、高响应、高鲁棒性的多语言实时音视频同传大模型。实现了离线和实时两种音视频翻译能力。🔗API调用方式
  6. 全新上线 Qwen-Image-Plus。参数规模200亿。具备卓越的文本渲染能力,在复杂文本渲染、各类生成与编辑任务中表现出色,模型性能大幅提升。🔗体验入口
  7. 全新上线 Qwen3-Coder-Plus-2025-09-23。该快照版本 Coder 模型和 Qwen Code 系统联合训练,下游任务效果和工具调用鲁棒性提升,大幅提升代码安全性。🔗体验入口
  8. 最新上线Qwen3-Omni系列Flash版本。Qwen3-Omni-Flash、Qwen3-Omni-Flash-Realtime(qwen3-omni-flash的实时版)、Qwen3-Omni-Flash-2025-09-15、Qwen3-Omni-Flash-Realtime-2025-09-15。支持文本、图像、音频、视频的高效理解与语音生成能力,可进行119种语言文本交互和20种语言语音交互。广泛应用于文本创作、语音助手、多媒体分析等场景。开源一款音频细粒度分析模型Qwen3-Omni-30B-A3B-Captione。专为在复杂多变的音频场景中生成精准、全面的内容描述而设计,能够在多声源、混合化的环境中亦保持稳定而可信的输出。🔗Qwen3-Omni-FlashAPI调用方式🔗 Qwen3-Omni-Flash-RealtimeAPI调用方式🔗Qwen3-Omni-30B-A3B-CaptioneAPI调用方式
  9. 最新上线 Qwen3-TTS-Flash-Realtime、Qwen3-TTS-Flash-Realtime-2025-09-18、Qwen3-TTS-Flash,Qwen3-TTS-Flash-2025-09-18。均能低延迟高稳定地合成音频,同时支持多种语言,方言,支持同一音色多语言输出。经过海量数据训练,合成音频可以根据文本自适应调节语气,对复杂文本合成也有较好的处理能力。🔗Qwen3-TTS-Flash体验入口🔗Qwen3-TTS-Flash-RealtimeAPI调用方式
  10. 最新上架 Wan2.2-Animate-Mix(角色替换模型)、Wan2.2-Animate-Move(角色动画生成模型)。只需上传一张角色照片和一段表演视频,即可将表情与动作迁移至照片角色,精准还原场景、光照与色调,生成高保真动画视频。🔗Wan2.2-Animate-Mix API调用🔗Wan2.2-Animate-Move API调用
  11. 新上线Qwen3-Next系列模型 Qwen3-Next-80B-A3B-Instruct、Qwen3-Next-80B-A3B-Thinking。相较上一版本(通义千问3-235B-A22B-Instruct/Thinking-2507)在文本理解、逻辑推理和文本生成等方面均展现出卓越性能,同时具备更高的效率和更低的资源消耗。🔗体验入口
  12. 新上线 Qwen-Plus-2025-09-11 快照版。相较于qwen-plus-2025-07-28,在思考模式下提升了指令遵循能力、总结回复更加精简。在非思考模式下中文理解与逻辑推理能力得到增强。🔗体验入口
  13. 新上线 Qwen3-ASR-Flash、Qwen3-ASR-Flash-2025-09-08 快照版。基于Qwen3-Omni模型基座训练而成,支持多语言识别、歌唱识别、噪声拒识等功能,能将录制好的音频精准地转换为文本。🔗API调用方式
  14. 新上线语音合成 CosyVoice-v3-plus、CosyVoice-v3 模型。较之前版本在自然度、音质、韵律、情感表现力上有更好的表现。支持文本至语音的实时流式合成。增加了更多小语种支持(德、西、法、意、俄)。仅需提供5-20s的参考音频,即可迅速生成高度相似且听感自然的定制声音。(邀测体验)🔗申请入口
  15. 新上线 DeepSeek-V3.2-Exp 模型。混合推理架构模型,同时支持思考模式与非思考模式,引入稀疏注意力机制,旨在提升处理长文本时的训练与推理效率,价格低于 deepseek-v3.1。🔗体验入口

2.2. 模型迭代更新

  • 最新更新 Qwen-Image-Edit Qwen-Image-Edit-2509 版本。对于多图输入提供“人物+人物”,“人物+商品”,“人物+场景” 等多种玩法。 对于单图输入, 显著提高了一致性。🔗体验入口
  • 全新升级 Qwen3-MT 模型,Qwen-MT系列模型模型上下文窗口长度提升至16K,能够提供更丰富的背景信息、调整翻译的风格,获得更精准、可控的翻译体验。🔗体验入口
  • 全新升级 Qwen-VL-OCR-Latest 模型已更新为最新快照版本【通义千问VL-OCR-2025-08-28】。08-28快照版本在文字定位能力、通用文字识别及卡证票据信息抽取能力均有提升,🔗体验入口
  • 阿里云百炼已于2025年9月16日更新升级 Qwen-PlusQwen-Plus-2025-07-28 快照版、Qwen-VL-Max Qwen-VL-Max-2025-08-13 快照版、 Qwen-VL-Plus Qwen-VL-Plus-2025-08-15 快照版。计费同步变更。🔗查看公告🔗查看公告
  • 阿里云百炼将于2025年10月22日更新 Qwen3-Coder-Plus Qwen3-Coder-Plus-2025-09-23 快照模型相较上一版本(7月22日快照)在下游任务效果和工具调用方面鲁棒性有所提升,代码安全性增强。🔗查看公告

3. 最新活动

1️⃣阿里云百炼狂欢购来袭。成为阿里云百炼云大使,一起瓜分90000元现金奖池。🔗活动入口


如果需要进一步了解阿里云百炼的,可直接点击下面链接哦:

👉阿里云百炼详情了解可点击此官网链接:阿里云百炼官网介绍

👉阿里云百炼控制台页面可点击此链接直接进入阿里云百炼控制台

相关文章
|
缓存 自然语言处理 API
阿里云百炼产品月刊【2025年8月】
阿里云百炼平台8月推出多项更新与活动。通义千问系列重磅升级,新增多款图像、语音及研究模型,如Qwen-Image、Qwen-Image-Edit、Qwen-MT-Image、Wan2.2-S2V等,全面增强图文生成与编辑能力。推出Qwen-Flash轻量模型,优化代码与推理性能,支持高并发低延迟场景。平台服务稳定性提升,部分模型计费策略调整,上下文缓存价格降低至input_token的20%,并提供100万免费token额度。同步上线“实训Agent创客”活动,助力用户快速上手新模型,提升实践能力。
341 0
|
3月前
|
缓存 自然语言处理 数据可视化
阿里云百炼产品月刊【2025年7月】
阿里云百炼平台7月推出多项更新与活动,。通义大模型家族迎来五连发升级,推出Qwen-Plus-2025-07-28快照模型,支持1M上下文长度,新增Qwen3-Coder-Plus,具备强大Coding Agent能力。同时,通义万相2.2系列全面升级,文生图、文生视频能力大幅提升。多项模型限时优惠,Qwen3-Coder-Plus最高享5折,Qwen-Plus、Qwen-Turbo价格下调50%,Qwen-MT-Plus降价80%。应用模块新增UI设计器,支持可视化构建Web App。另有多种活动上线,包括Agent创客实训、Qwen3-Coder挑战赛及全栈焕新课程。
838 2
|
人工智能 文字识别 自然语言处理
阿里云百炼产品月刊【2025年6月】
阿里云百炼平台6月推出多项更新与活动,涵盖Agent市场、多模态交互开发套件、新模型上线及商业化调整。新增100+开箱即用Agent模板,支持多行业多场景应用;推出通义多模态交互开发套件,提升全场景适配能力;联合支付宝推出Agent赞赏功能,助力创意变现;新上架text-embedding-v4、deepseek-r1-0528、qvq系列视觉推理模型等,并对qwen-plus、qwen-turbo等模型进行迭代升级。同时,部分历史模型将于7月下线,建议用户及时调整应用。更多详情请查看官网公告。
575 0
|
25天前
|
自然语言处理 测试技术 API
通义Qwen3-Max:大就是好
通义千问Qwen3-Max正式发布,参数超1T,训练稳定高效,在代码、推理、多语言等任务中表现卓越。预览版已登顶LMArena榜单前三,支持阿里云百炼API调用与Qwen Chat体验,敬请试用。
1103 32
|
29天前
通义万相2.5-图生视频-Preview,模型使用指南
该表格展示了多个设计场景,包括模型选择、复制粘贴提示词与图片、一键生成视频等步骤。每个步骤配有详细描述及示意图,呈现了不同主题和风格的设计构思与实现方式。
|
6天前
|
人工智能 缓存 搜索推荐
阿里云百炼产品月报【2025年10月】
通义千问本月重磅升级:发布9款Qwen3-VL多模态模型,支持视频理解、2D/3D定位;MCP生态新增17项服务;推出电商AI生图模板,助力商家降本增效。
|
2月前
|
人工智能 Cloud Native 安全
解读阿里云刚发布的《AI 原生应用架构白皮书》
阿里云在云栖大会重磅发布了《AI 原生应用架构白皮书》,该白皮书覆盖 AI 原生应用的 11 大关键要素,获得业界 15 位专家联名推荐,来自 40 多位一线工程师实践心得,全书合计超 20w 字,分为 11 章,全面、系统地解构 AI 原生应用架构,包含了 AI 原生应用的 11 大关键要素,模型、框架、提示词、RAG、记忆、工具、网关、运行时、可观测、评估和安全。本文整理自阿里云智能技术专家李艳林在云栖大会现场的解读。
1230 36

相关产品

  • 大模型服务平台百炼