阿里云大数据& AI 产品技术月刊【2026 年 3 月】,涵盖 3 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
一、产品功能发布
人工智能平台 PAI - DSW集成OpenClaw:实现智能化云端开发
PAI-DSW提供OpenClaw自动化安装方案,支持系统操控、持久记忆、定时推送能力,可通过Web UI或钉钉交互,让AI智能体"住"在算力旁边。
人工智能平台 PAI - PAI-EAS PD分离智能配置发布
当用户部署基于 PD 分离的大规模分布式推理服务时,小 PAI 助手能够结合其模型特征、机型配置及 I/O 长度等关键信息,智能推荐合适的 PD 比例与并行策略,以提升资源利用率与端到端性能。
PAI全局搜索支持一键检索DSW实例、DLC任务、EAS服务、模型等资源,通过关键词快速定位目标资产,提升资源查找效率。
人工智能平台 PAI - PAI-EAS模型预热缓存功能发布
模型预热缓存服务是用于预先加载指定模型缓存的独立服务,能够为启用模型缓存加速的推理服务提供高速访问的数据源。适用于LLM、AI生图、AI生视频等需要使用OSS/NAS挂载大型模型文件的场景。
云原生大数据计算服务 MaxCompute - MaxCompute支持Iceberg外部表
MaxCompute支持用户提交指定Schema的DDL构建Iceberg外部表,也支持基于iceberg文件中的元数据动态生成表Schema和分区信息
云原生大数据计算服务 MaxCompute - 模型计算服务发布
模型计算服务是MaxCompute为满足用户使用大模型进行数据处理或离线推理提供的一种开箱即用、按量付费的新功能.
云原生大数据计算服务 MaxCompute - MaxFrame Coding Skill 正式发布
MaxFrame Coding Skill 正式发布,全面赋能 AI Agent 实现智能化 MaxFrame 作业开发
云原生大数据计算服务 MaxCompute - MaxFrame 新增多模态数据处理算子模块
MaxFrame 本次新增内置 Image 算子,支持海量图像数据的分布式处理
云原生大数据计算服务 MaxCompute - MaxFrame AI Function 功能增强
MaxFrame AI Function 功能重大升级,新增支持阿里云百炼商业化大模型(qwen3-max、text-embedding-v4),并提供按 Token 计费模式(按量付费)
云原生大数据计算服务 MaxCompute - MaxFrame 新增本地化调试功能
MaxFrame 新增本地调试模式(Local Debug Mode),开启本地调试模式后MaxFrame UDF函数支持在本地 Python环境中直接执行,支持IDE断点调试,完全离线可用
云原生大数据计算服务 MaxCompute - MaxFrame DPE 引擎自定义镜像支持
MaxFrame 现已支持在 DPE(分布式 Python 计算引擎)中使用用户自定义镜像,满足用户作业对特定依赖与运行环境需求
云原生大数据计算服务 MaxCompute - MaxFrame OSS 数据挂载功能增强
MaxFrame 增强 OSS 数据挂载功能,现支持多 OSS Bucket 挂载与路径前缀配置
云原生大数据计算服务 MaxCompute - MaxFrame 网络与安全增强
MaxFrame DPE 引擎新增对网络访问白名单配置,用于控制 MaxFrame UDF 执行时的网络访问权限
实时数仓 Hologres - 向量索引支持附加列,大幅提升检索性能
支持在向量索引上附加列信息,检索时可直接通过索引获取列值,无需查询目标表对应列,提升向量检索性能
实时数仓 Hologres - 支持AI Function调用百炼大模型构建AI应用
Hologres 与阿里云百炼深度打通,通过 API Key 即可在 Hologres 中部署百炼模型,然后使用 AI Function 调用百炼模型,数据不出库即可完成 AI 开发、构建 AI 应用
实时数仓 Hologres - Dynamic Table支持自动查询改写
Dynamic Table支持自动查询改写能力:当某张基表上已经通过 Dynamic Table 做了预聚合,优化器可以在满足条件时,将面向基表的聚合查询自动改写为面向DT的查询,提升查询效率
实时数仓 Hologres - Dynamic Table提供多个任务级别监控指标
自V4.0.8版本起,Dynamic Table提供多个任务级别的监控指标,如刷新失败、数据延迟等指标,方便精细化运维管理相关刷新任务
实时数仓 Hologres - 支持User Id Encoding 函数
通过将高基数字符串映射为整型 ID,配合 Dynamic Table 的增量计算,实现超大规模实时 UV 的低成本极速计算。
实时数仓 Hologres - 支持EXTERNAL_FILES函数免外表分析湖数据
新增 EXTERNAL_FILES 函数,支持在不创建外部表的情况下通过标准 SQL 直接分析 OSS 上的 Parquet 或 ORC 格式文件。
实时数仓 Hologres - 同城冗余存储(3AZ)支持日本、杭州region
适用客户:有容灾需求的金融、互联网等客户;新增功能/规格:同城冗余存储(3AZ)支持日本、杭州region
实时数仓 Hologres - 基于Mem0实现大模型长记忆
Hologres 基于 Mem0 框架,结合高性能向量检索能力,推出大模型长记忆方案
实时数仓 Hologres - Dify支持使用Hologres实现RAG的双路召回
Dify 1.13.1支持使用Hologres全文+向量检索实现RAG双路召回
大数据开发治理平台 DataWorks - 数据开发 SQL 节点支持配置质量测试规则
数据开发 MaxCompute SQL 节点支持配置质量测试规则,可用于校验该节点产出的开发及生产数据表,提高生产效率。
大数据开发治理平台 DataWorks - 数据开发 SQL 节点支持数据治理事前深度检查
数据开发 SQL 节点支持数据治理事前深度检查,可基于 AI 能力定义自定义规则,在编码时实时发现并修复代码问题,提升代码质量和数据安全。
大数据开发治理平台 DataWorks - 数据运维 Agent 上线
数据运维 Agent 可通过融合依赖链路、资源水位、历史运行趋势、变更影响、日志异常及数据质量等多维度分析,自动生成结构化的诊断报告。
大数据开发治理平台 DataWorks - 运维助手支持批量运维
用户可以手动填写或者上传一个文件,对这个文件中的所有实例进行批量运维动作,提高运维效率。
大数据开发治理平台 DataWorks - 管理中心工作空间支持从简单模式升级到标准模式
支持工作空间从简单模式升级至标准模式,包括适用于已开启 DataStudio 新版 IDE 的工作空间,助力团队实现更精细化的权限管理与任务协作。
大数据开发治理平台 DataWorks - 数据地图新增支持 DLF 表权限申请与数据预览
在数据地图中可对 DLF 表发起权限申请,同时新增基于 Serverless Spark 计算资源和自定义脚本实现数据预览,提升数据获取效率与用数安全性。
大数据开发治理平台 DataWorks - ChatBI 支持深度分析模式
DataWorks ChatBI 新增深度分析模式,支持多维下钻、根因分析、时序对比、异常检测和智能归因,可自动挖掘数据背后的趋势、关联与深层原因,提升分析和决策能力。
大数据开发治理平台 DataWorks - 数据服务支持云原生 API 网关
DataWorks 数据服务新增支持云原生 API 网关,可通过向导或脚本模式快速将数据封装为 API,一键发布并提供高可用、可监控的在线调用。实现数据能力的服务化输出,加速业务集成与创新。
大数据开发治理平台 DataWorks - 数据分析面向多种数据源提供全量数据查询模式
DataWorks 数据分析支持对 Hologres、ClickHouse、MySQL 等数据源的全量查询,轻松应对单次超万条或 10MB 以上的海量结果分析,显著提升复杂查询效率。
大数据开发治理平台 DataWorks - 支持 MySQL 整库离线至 DLF(Paimon)
DataWorks 数据集成新增支持 MySQL 整库离线同步至 DLF,目标格式为 Paimon,提升了数据入湖效率,进一步丰富了开放数据源生态的连接能力。
检索分析服务 Elasticsearch版 - ES AI 搜索产品方案支持百炼平台模型调用
阿里云 Elasticsearch 控制台支持接入百炼平台中的模型,在 ES 中通过 Inference API 调用百炼平台的 AI 模型服务。
检索分析服务 Elasticsearch版 - 8.17版本支持日志增强服务
ES 8.17版本新增日志增强服务,支持中国站按量付费实例通过白名单方式开通,提升日志采集、分析和管理能力。
检索分析服务 Elasticsearch版 - 8.17版本新增归档数据节点
ES 8.17版本新增归档数据节点,支持中国站预付费实例通过白名单方式开通,降低冷数据长期存储成本。
检索分析服务 Elasticsearch版 - ES 控制台功能优化
通过提供更完善的配置和变更能力,提升产品易用性
检索分析服务 Elasticsearch版 - 发布跨地域高可用方案
基于跨集群复制 CCR 实现同地域/跨地域的主备容灾高可用
检索分析服务 Elasticsearch版 - 发布 Agent 记忆方案
基于 ES + Mem0 提供 Agent 记忆存储与管理方案,助力 AI 应用构建长期记忆能力。
二、产品快讯
阿里云 PAI 与 NVIDIA 在 Physical AI 领域推出了一系列更新,旨在解决客户反馈的痛点。以下是主要更新内容:Isaac Lab 分布式感知强化学习、Newton 物理引擎与 Rerun 可视化、Isaac Lab-Arena 模块化测评环境。
轻量化起步,更低门槛上手向量检索 —— 阿里云 Milvus 单机版正式上线!
阿里云 Milvus 单机版正式上线,旨在为初创企业、个人开发者和小型项目提供轻量化、低成本的向量检索解决方案。该版本支持一键开通和灵活配置,适合快速部署AI应用。最低月费仅需628元,提供包年和按量付费两种模式。
阿里云荣获 2025–2026 年度 Elastic 中国最佳合作伙伴奖
在3月17日举行的 Elastic{ON} 2026 新加坡大会上,阿里云荣获 “2025–2026 年度 Elastic 中国最佳合作伙伴奖(Top China Partner)”,以表彰阿里云在过去一年中,推动 Elasticsearch 产品技术落地、生态拓展及业务增长方面的卓越表现。
阿里云大数据 AI 平台在 2026 年春季发布会上进行升级,推出以 Agentic Lake 为核心的智能体基础设施,强调数据与 AI 的深度协同。新平台支持自然语言交互和任务自动化,降低中小团队的使用门槛。核心更新包括全面 Agentic 化的引擎、DataWorks Data Agent 交互桥梁,以及支持大模型训练的 PAI 平台,助力科研自动化和企业智能应用。
三、最佳实践
探讨了数据开发中的质量治理问题,强调了开发与治理的分离导致的挑战。通过引入 Data Contracts 理念,DataWorks 实现了数据质量规则与代码的整合,确保质量治理在开发流程中的前置化。提出了一体化开发治理的工作流,旨在提升工程效率和数据质量信任度,并规划未来的多引擎支持与智能化生成。
UV 点击率提高30%,梦饷科技基于阿里云PAI实现电商推荐架构升级
梦饷科技与阿里云 PAI 合作,通过 AI 技术重构电商推荐架构,成功提升 UV 点击率30%。借助 PAI-Rec 和 TorchEasyRec,构建了云原生推荐系统,优化了特征选择、深度学习算法和精细化召回能力。项目实施后,用户兴趣度和交易额显著增长,达成年度业务目标。
最强打工外挂:教你在PAI-EAS用CoPaw打造专属AI助理
阿里云的 CoPaw(协同个人智能体工作站)现已开源,提供了一个本地优先、可自托管的个人 AI 智能体框架。通过阿里云PAI-EAS,用户可以在5分钟内轻松部署专属的 CoPaw Agent,享受高度定制化的AI助理体验。CoPaw 支持多种模型资源,并与钉钉、飞书等办公平台无缝集成,帮助用户提升工作效率,管理任务。
人工智能平台 PAI:一键部署 OpenClaw,让龙虾陪你一起训模型
阿里云人工智能平台 PAI 现已支持在 PAI-DSW 中一键安装 OpenClaw,通过将 OpenClaw 与 AI 算力、训练环境及文件存储深度集成于同一环境,龙虾可直接执行文件读写、GPU 状态监控及训练任务分发,实现真正意义上的云端智能化开发。
OPC时代,AI底座先行——FlagOS携Qwen3-8B镜像正式登陆阿里云
众智 FlagOS 携 Qwen3-8B 镜像正式登陆阿里云,为开发者提供一套开源的AI系统软件栈,支持多种异构 AI 芯片,实现模型的快速部署与迁移。FlagOS 与阿里云的深度集成使得用户能够高效利用 PyTorch,无需修改代码即可获得高性能推理。
PAI Physical AI Notebook详解6:Isaac Lab分布式感知强化学习
基于 NVIDIA Isaac Lab 的分布式感知强化学习,强调了利用多模态感知数据(如 RGB 图像、深度图像)提升机器人自主决策能力的必要性。通过 TiledCamera 组件,减少了渲染开销,实现了高效的视觉数据处理。研究表明,扩大 GPU 规模不仅加快训练速度,还能提升策略质量,且多卡配置在保持准确性的同时显著缩短实验周期。
Mem0 + Elasticsearch:构建 AI 记忆系统
Mem0 与 Elasticsearch 的结合可构建 AI 记忆系统,解决大语言模型的无状态设计限制,支持记忆持久化、语义检索和智能更新。该系统适用于长交互信息处理、跨会话上下文保持及多 Agent 协同,提升电商导购和智能客服的用户体验。通过配置 Mem0 框架和 Elasticsearch,开发者可实现记忆的添加、检索及删除。
用 SQL 调大模型?Hologres + 百炼,让数据开发直接“对话”AI
阿里云 Hologres 与百炼大模型平台的结合,通过 SQL 实现自然语言数据查询,解决了 AI 与数据割裂、工程成本高和技术栈不匹配等问题。百炼提供托管式大模型服务,支持多模态理解,简化数据开发者的工作。无论是处理非结构化数据还是智能客服,Hologres + 百炼都能高效提升业务洞察,推动数据开发进入 AI 时代。
检索的终局是决策:OLAP 如何重塑 Hologres 多模混合检索的价值边界
Hologres 的 HSAP 2.0 架构通过将 OLAP 能力融入多模检索,提升了检索系统的决策能力。它实现了实时分析与检索的无缝结合,支持更深层次的业务洞察,消除了数据传输延迟,确保结果一致性。该架构在电商、企业知识库和金融风控等领域展现出强大价值,使检索系统不仅能查找信息,还能驱动商业决策。
告别“金鱼记忆”:Hologres + Mem0,为大模型打造企业级长记忆引擎
Hologres 与 Mem0 的结合旨在为大语言模型(LLM)应用构建企业级长记忆引擎,解决大模型在智能客服等场景中面临的“金鱼记忆”问题。Mem0 作为开源框架,自动管理记忆生命周期,而 Hologres 则提供统一的实时数据存储与检索能力。Hologres 的极致性能、灵活的混合检索以及企业级安全性使其成为理想基础设施,为个性化智能客服、企业知识助手和 AI 游戏 NPC 等应用场景提供支持。
优路教育借助阿里云Flink+StarRocks+Paimon湖仓一体化构建职业教育业务全链路实时数据服务平台
优路教育与阿里云合作,利用 Flink、EMR Serverless StarRocks 和 Paimon 构建全链路实时数据服务平台,实现了从“分钟级延迟”到“秒级响应”的转变,支持学员画像、营销筛选及题库查询等功能。面对数据规模和复杂度的挑战,优路教育采用新架构解决了多表关联查询和实时分析的痛点,提高了数据处理效率。
EMR Serverless Spark 携手 PAI/百炼,开启“SQL 即 AI”的新篇章
阿里云 EMR Serverless Spark 通过深度集成 AI Function,将大模型应用于海量数据的处理,开启了“SQL 即 AI”的新篇章。用户无需编写代码或移动数据,即可通过简单的 SQL 调用顶尖大模型,实现实时数据处理。
Celeborn 如何让 EMR Serverless Spark 的 Shuffle 舒心、放心、安心
Celeborn 通过解决传统 Spark Shuffle 的存算分离、高网络连接数、IO 性能和容错能力等问题,提升 EMR Serverless Spark 的性能和稳定性。此外,Celeborn 还具备完整的监控能力,优化的 Push Shuffle 和 Partition Split 机制,使得数据读取更加高效,用户在使用中感到舒心、放心和安心。