本月核心内容速递
- 多模态与语音模型全面升级:
本月新增 31 个新模型,涵盖视频生成、图像编辑、多模态等,重点包括 HappyHorse-1.0 系列、DeepSeek-V4、Qwen-Image-2.0-Pro、Qwen3.6 全系列、万相 2.7 等。 - 产品功能全面升级:
Token Plan 团队版上线,提供更加灵活的订阅方式;高代码应用支持 K8s 部署,满足不同场景需求使用;新增9个应用模板,为您提供多样化体验。 - AI实训营活动:
推出VOC客户之声专题实训营,提供从数据筛选、智能分类到深度洞察的全链路AI应用培训,帮助企业和开发者高效挖掘客户反馈价值,加速AI在实 际业务中的落地应用。
产品动态
阿里云百炼Token Plan已上线
- Token Plan 团队版是面向企业和开发者的 AI 大模型订阅服务,支持多模型灵活调用,兼容主流编程与智能体工具,提供企业级席位管理与数据安全保障,助力团队高效落地 AI 生产力。👉立即订阅
阿里云百炼控制台首页
- 新增常用功能模块,方便开发者快速管理API、查看用量以及开发AI应用等能力。👉立即体验
新增记忆库功能
为应用装上跨会话的长期记忆能力。👉记忆库
- 突破大模型上下文窗口限制,拥有跨会话长期记忆。使智能体能在不同会话间持续引用用户历史信息和偏好,实现连贯对话体验。
- 同时支持“记忆片段”和“用户画像”,双类型记忆。满足动态事件与静态属性的差异化记忆需求。
- 基于配置的记忆规则,在对话结束后自动提取、更新和存储记忆,实现自动化记忆管理,全程无需人工干预。
- 提供意图判别召回、查询改写、结果重排、相似度阈值设置及最大召回数量调节等功能,实现精细化检索控制。
- 支持多租户隔离与灵活扩展,以 user_id 为维度隔离不同用户的记忆数据,确保隐私安全;支持创建多个记忆库用于不同业务场景。
高代码应用全新升级
- 新增K8s部署方案,满足不同场景需求👉立即体验
- 实例级别计算存储网络隔离,满足agent在sandbox时代的隔离要求。
- 完全屏蔽异构的底层计算存储资源,支持serverLess与容器部署,满足轻量快速&复杂长程agent开发者需求。
- 网关更新,快速生产使用
- 支持APIG/ALB两种生产级别网关,支持7层&4层网络栈。
- 默认打开安全策略&无感生产公网域名调用。
- 前端页面体验更新
- 新增快读文本对话体验、 API测试、自定义前端&前端卡片编码接入能力。
- 新增接入工具
- 支持一站式 MCP 工具接入,可在工具 Tab 中为应用关联知识库、工作流、插件等 MCP 服务。
Coding Plan
- Pro版本新增支持qwen3.6-plus 。👉Coding Plan
MCP广场上线
- 新增门诊出诊信息查询MCP服务,本服务面向保险机构、康养机构等健康服务提供方,提供标准化的门诊出诊信息查询接口,助力合作伙伴提升医疗信息服务的互通性与用户体验。
- 新增DataWorks阿里云官方 MCP 服务,让您快速透过 MCP 使用大数据开发治理服务
- 新增金融综合问数MCP服务,提供全面的金融数据查询服务,覆盖股票、基金、债券、指数、行情、理财、期权等金融产品数据,支持宏观行业经济数据、研报、工商信息查询,支持条件选股票、条件选基金,满足金融分析、投资研究等场景的数据需求。
- 新增Proboost跨境数据分析助手MCP服务应用,专注于跨境商业数据服务工具,帮助跨境电商从业者、品牌方和营销人员快速获取海外市场动态、竞品情报与内容趋势。
- 新增天气通MCP服务应用,天气通是新浪微博旗下的国内领先气象数据服务商,依托权威气象数据源和天气通4亿用户验证的权威气象数据体系,支持为开发者和企业提供高精度、实时、全面的天气查询与预报服务。
应用广场上新
本周新增5个三方应用模板:
应用模板名称 |
应用能力 |
用于实时追踪股票和 ETF 的盘面变化,帮助用户快速了解市场当前强弱、热点轮动、指数表现和个股异动情况。无论是盘中看市场、午盘复盘,还是收盘总结、分析某只股票突然拉升或跳水的原因,都可以获得清晰解读。 |
|
用于帮助用户快速看懂热点事件、板块消息、个股新闻、研报和利好线索。无论是想知道一个热点概念为什么火、某条消息会影响谁,还是一只股票最近有什么重要新闻或利好,都可以通过消息解码快速获得更清晰的结论。 |
|
用于从技术走势、财务质量、估值水平和市场情绪等角度研究一只股票。用户可以根据自己的关注点,快速获得对应维度的分析结果,更高效地理解个股当前状态、价格位置和市场关注度,适合做进一步判断前的专题分析。 |
|
用于从收益表现、长期业绩和风险水平等角度筛选基金。用户可以快速判断一只基金赚得怎么样、长期表现稳不稳、风险大不大,更高效地完成基金初筛、对比和选择,适合做长期配置前的参考分析。 |
|
用于对股票或基金做整体综合判断。无论是想了解一只股票是否值得关注,还是判断一只基金是否适合长期持有,都可以通过投资诊断快速获得更全面的分析结论,适合在单项分析前做整体判断,也适合作为最终决策参考。 |
模型动态
- 本月共上线31个模型,详情可参考下表。
模型类型 |
上架时间 |
模型规格 |
功能说明 |
图生视频 |
2026-04-27 |
HappyHorse-1.0-I2V支持图生视频,具备高度还原的动态画面生成能力,能够精准理解文本语义,输出流畅自然、细节丰富的高质量视频。 |
|
文生视频 |
2026-04-27 |
HappyHorse-1.0-T2V支持文生视频,具备高度还原的动态画面生成能力,能够精准理解文本语义,输出流畅自然、细节丰富的高质量视频。 |
|
参考生视频 |
2026-04-27 |
HappyHorse-1.0-R2V支持参考生视频,更加稳定的主体与场景参考,支持最多9张图片参考,能够精准保持创作意图,实现更强表现能力。 |
|
视频编辑 |
2026-04-27 |
HappyHorse-1.0-Video-Edit支持视频编辑,自然语言指令编辑视频,可参考最多5张图片局部或全局编辑视频元素,能够精准复刻视频动态过程,实现更强表现能力。 |
|
推理模型 |
2026-04-24 |
DeepSeek-V4系列模型,阿里直供。deepseek-v4-pro为旗舰模型,deepseek-v4-flash为轻量级高速模型。 |
|
图像生成 |
2026-04-23 |
Qwen-Image-2.0系列模型,实现了图片生成和图片编辑的融合。相较于3月3日快照,本模型在画面质感,尤其是纹理细节、光影、材质上有明显跃升;支持多语言的图内文字生成;艺术风格表现更加均衡。 |
|
推理模型 |
2026-04-23 |
Qwen3.5原生视觉语言系列Plus模型新快照,相较2月15日快照Agentic coding能力大幅提升,推理速度显著提升;知识、推理与长上下文能力保持较高水准,适合编码智能体、生产工作流和高吞吐场景。 |
|
推理模型 |
2026-04-23 |
Qwen3.6系列27B原生视觉语言Dense模型,相较3.5-27B重点提升Agentic coding能力,STEM与推理能力进一步增强;视觉模态方面空间智能、物体定位与检测能力显著增强,视频理解、文档OCR及视觉Agent能力稳步提升。 |
|
文生文与视觉理解 |
2026-04-21 |
Kimi最新最智能的模型,具备更强更稳的长程代码编写能力,指令遵循和自我纠错能力显著提升。同时支持文本、图片与视频输入、思考与非思考模式、对话与 Agent 任务。 |
|
推理模型 |
2026-04-20 |
Qwen3.6系列规模最大的闭源模型,Coding能力进一步提升、Agent执行更加高效。仅支持纯文本输入,支持思考模式(默认开启),支持显式缓存和Function Calling。文本生成模型概述。 不支持图像与视频输入。 |
|
推理模型 |
2026-04-16 |
Qwen3.6原生视觉语言系列Flash模型,模型效果相较3.5-Flash显著提升。本模型重点提升agentic coding能力(在多项代码智能体基准上大幅超越前代)、数学推理和代码推理能力;视觉方面在空间智能能力上显著增强,物体定位与目标检测提升尤为突出。 |
|
推理模型 |
2026-04-16 |
Qwen3.6系列35B-A3B原生视觉语言模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。模型效果相较3.5-35B-A3B显著提升了agentic coding能力、数学推理和代码推理能力、空间智能能力、物体定位与目标检测能力。 |
|
推理模型 |
2026-04-14 |
智谱GLM-5.1模型,专为长程任务设计,支持 200K 上下文,最大输出可达 128K Token。通过强大的逻辑推理、长文本理解及代码生成能力,在多项基准测试中表现优异,适用于智能交互、企业应用及开发辅助等场景。GLM |
|
图/文生视频 |
2026-04-03 |
万相2.7-图生视频模型,支持多模态输入(文本/图像/音频/视频),可完成首帧生视频、首尾帧生视频、视频续写三大任务。万相-图生视频2.7 |
|
参考生视频 |
2026-04-03 |
万相2.7参考生视频模型,支持主体参考和音色定制,并可输入单张多宫格故事板直接生成剧本化视频。万相-参考生视频 |
|
视频编辑 |
2026-04-03 |
万相2.7-视频编辑模型,支持指令编辑与视频迁移任务,可修改视频局部或整体画面,同时支持多图参考替换及动作、特效、运镜的复刻。万相-视频编辑2.7 |
|
推理模型 |
2026-04-02 |
千问3.6-Plus,代码开发能力重点升级(Agentic Coding、前端编程等),Vibe Coding体验显著提升;泛化场景推理能力进一步增强;多模态方面,万物识别、OCR、物体定位等能力显著提升;同时修复了Qwen3.5-Plus上线后的已知问题。使用方法与qwen3.5-plus一致。文本生成模型概述 |
|
图像生成与编辑 |
2026-04-01 |
万相2.7-图像生成与编辑模型,支持文生图、文生组图、图生组图、图像编辑、多图参考生成、交互式编辑,在文字渲染、主体一致性、复杂指令遵循表现更优。Pro系列支持4K输出;加速版兼顾效果与响应速度。万相-图像生成与编辑2.7 |
|
多模态 |
2026-04-01 |
支持文本,图片,音频,音视频理解与交互。支持超过 10 小时的音频理解及超过 400 秒的 720P(1 FPS)音视频理解与对话,并进一步拓展语言范围,支持60+种语言音频输入,30+语言语音输出,并且具备强大的结构化音视频理解能力,广泛应用于文本创作、语音助手、多媒体分析等场景。 |
|
多模态 |
2026-04-01 |
Qwen3.5-Omni-Flash、Qwen3.5-Omni-Flash-2026-03-15 |
|
实时多模态 |
2026-04-01 |
Qwen3.5-Omni-Plus-Realtime、Qwen3.5-Omni-Plus-Realtime-2026-03-15 |
支持文本,图片,音频,音视频理解与交互。支持60+种语言音频输入,30+语言语音输出以及可控语音对话,WebSearch和复杂FunctionCall的调用,并且具备智能语义打断的交互能力,广泛应用于文本创作、语音助手、多媒体分析等场景。 |
实时多模态 |
2026-04-01 |
Qwen3.5-Omni-Flash-Realtime、Qwen3.5-Omni-Flash-Realtime-2026-03-15 |
最新活动
- 🥳AI实训营活动进行中!本期活动带你了解如何用 AI 聆听客户之声,带你打通从“数据筛选、智能分类”到“深度洞察、业务结论”的全链路闭环,让 AI 帮你理清千头万绪。参与活动还有阿里云百炼定制礼品领取。活动入口