阿里云大数据& AI 产品技术月刊【2026年1月】,涵盖1月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
一、产品功能发布
人工智能平台 PAI - KV Store全局上下文缓存发布
EAS部署LLM服务的过程中支持配置KV Store的全局上线文缓存,通过GPU→内存→Redis kv metadata的多级存储查询来提升kvcache命中率,提升LLM推理吞吐性能。
人工智能平台 PAI - PAI智能助手诊断二期:支持DLC任务、EAS服务诊断
PAI智能助手(小PAI)智能诊断能力升级 1.降低AI工程门槛 2.提升资源使用效率 3.保障业务连续性 4. 知识沉淀与复用。
EAS 针对多机多卡的分布式服务实例单元以及普通服务实例,提供资源配额(quota)和优先级排队的诊断能力,帮助客户快速定位资源相关问题。
AutoML在新加坡正式开服。
人工智能平台 PAI - DLC联合训练发布模型保护策略功能
PAI DLC 支持模型提供方在平台设定策略参数显式声明是否允许基于该数据产出的联合模型被导出,实现“数据使用即授权、模型产出可管控”的端到端隐私与知识产权保护机制,兼顾协作效率与合规安全。
PAI 在智算场景,支持将算力CPU按照vcpu性能分为高、中和低等级,训练任务按照负载特点选择不同性能等级的vcpu,实现计算差异化使用,从而提升整体计算性能,预计提升计算性能 10%~30%
云原生大数据计算服务 MaxCompute - MaxFrame新增Embedding等预设大模型推理接口
MaxFrame AI Function 新增提供translate(翻译)、extract(结构化抽取)、embedding(向量化) 等预设标准化任务接口,可直接调用大模型推理能力
云原生大数据计算服务 MaxCompute - MaxFrame 新增 DLF Paimon 读写支持
MaxFrame 新增对 MC External Project 管理的 DLF Paimon 表读写支持
实时数仓 Hologres - 全文检索支持IK、Ngram、拼音分词器
全文检索支持IK、Ngram、拼音分词器,更广泛应用于中文描述类文本、日志类文本、中文商品/人名拼音等检索场景
实时数仓 Hologres - 自适应Serverless计算能力增强
自适应Serverless计算能力增强,支持自动负载隔离,负载高时自动切流至Serverless Computing资源池,显著提升系统吞吐能力与稳定性
实时数仓 Hologres - 表结构变更(Rebuild)能力增强
Rebuild能力增强,表结构变更过程中的写入受影响时长缩短至 10 秒以内,执行期间表可以正常查询
开源大数据平台 E-MapReduce - 全托管Spark支持纳管文件目录
- 新增支持纳管NAS文件目录,挂载纳管NAS文件目录后,用户可以在Notebook、数据开发任务中对纳管文件目录中的文件进行读写操作。
- 单个工作空间新增支持纳管多个文件目录。
- 纳管文件目录支持挂载至 Spark Executor,挂载后所有Executor可以以本地路径访问挂载文件。
开源大数据平台 E-MapReduce - 全托管Spark支持按量转包年包月
支持按照队列粒度按量转包年包月,灵活满足业务需求。
开源大数据平台 E-MapReduce - 全托管Spark支持数据目录
数据目录添加 DLF Catalog 后,原生支持使用Catalog下所有格式的表,如 Paimon Table 和 Iceberg Table。
检索分析服务 Elasticsearch版 - 乌兰察布行业合规云售卖发布
开放区域:华北6(乌兰察布行业合规云)。
墨西哥Region国际站发布。
智能开放搜索 OpenSearch - 行业算法版支持OBJECT和NESTED两种复合数据类
行业算法版支持OBJECT和NESTED两种复合数据类型,允许将多个字段组合在一起,形成嵌套结构。正确使用复合数据类型,能提升查询准确性,避免错误匹配,让复杂数据管理更高效。
智能开放搜索 OpenSearch - 新增人脸多模态向量模型与人脸主体识别模型
提供多模态向量和主体识别服务中的人脸检测与向量化模型,提升视频检索效果。
一键支持从开源 Milvus 自建集群、Zilliz Cloud 以及阿里云 Milvus 实例(不同版本)平滑迁移至阿里云 Milvus。
向量检索服务 Milvus 版 - 支持同城多可用区容灾能力
支持在双可用区基础版和高可用版实例间构建同城容灾能力,显著提升整体服务的容灾等级和可靠性。
向量检索服务 Milvus 版 - 支持 OSS 数据加密能力
支持用户在新购时配置自定义 KMS 密钥对底层 OSS 数据进行加密存储,实现数据全链路加密保护。满足金融、政企等对数据安全与合规性的高级要求,降低敏感数据泄露风险。
简化创建流程并降低选型成本,带来更顺畅直观的采购与开通体验。
二、产品快讯
Agentic Search 是 OpenSearch 升级的企业 AI 搜索:以 Agent 将搜索、推理、规划与工具调用融合,形成“理解-规划-执行-反馈”闭环,从找文档进化为交付结果。提供对话/规划/自适应三模式,支持多模态解析、企业知识库 RAG、代码执行、联网搜索与爬虫等,并可输出 Markdown/HTML 报告,覆盖深度研究、智能客服与企业提效场景。
万字实战沉淀,阿里云Hologres首发《Serverless OLAP 技术白皮书》
传统 OLAP 因存算一体与静态规划,低谷期也需全量在线,资源利用率低、成本与运维压力大。Hologres 提出 Serverless OLAP “Down to Zero”:按需秒级弹性、闲时降至零、强隔离与免运维,只为实际算力付费;通过共享弹性资源池、自动路由与纯 Serverless 实例实现。
EMR AI 助手再升级:支持 Serverless StarRocks
EMR AI 助手公测新增支持 Serverless StarRocks,面向参数调优、慢查询治理与异常排查等高门槛运维场景,提供智能对话、异常诊断和优化建议三大能力,可自然语言查询实例/SQL 状态、定位 CPU/内存/磁盘/超时等问题并给出修复与索引分区物化视图及参数调优建议;已在多区域开放体验。
Data+AI全面升级,阿里云OpenLake解决方案重磅更新
阿里云 OpenLake 方案升级:DLF 3.0 商业化实现全模态数据统一管理(Paimon 托管并兼容 Iceberg 等),统一元数据支持 PAI、MaxCompute、Hologres、Flink、EMR、ES、Milvus 等多引擎协同,一份数据多处计算。推出流存储 Fluss 公测,打通湖流一体将数据新鲜度提升到秒级、成本降 10 倍;EMR Serverless StarRocks 读写 Paimon 提升 100%,EMR Serverless Spark 全面支持 Spark 4.0 强化全模态预处理。
三、最佳实践
面向Interleaved Thinking的大模型Agent蒸馏实践
阿里云 PAI 基于 ReAct 交错思维构建多轮轨迹数据,提出“行为克隆 + 教师纠错”蒸馏流程,在 EasyDistill 框架实现一键生成轨迹并训练轻量 Agent。评测显示小模型在数学推理、多跳问答与 Deep Search 等需工具调用任务上稳定性与成功率显著提升,7B/8B 可接近甚至超过更大模型表现。
阿里云与模思智能基于 MaxCompute 构建一站式多模态数据处理平台,借助 MaxFrame 分布式引擎与 DataWorks 编排,实现音视频等非结构化数据在 OSS 上统一存储、Object Table 自动采集元数据并纳管,支持异构算力协同调度与稳定高并发处理。落地后峰值可扩展至数万核,资源利用率提升 30%+,预处理性能提升 100%,运维投入减少 50%。
AI时代最大的宝藏,也藏得最深:80%的企业知识沉睡在非结构化数据中
AI 时代企业 80% 知识沉睡在非结构化数据中,数据熵导致 RAG/Agent 易出错。Hologres 推出 HSAP 2.0 将向量/全文检索与 OLAP 原生融合,借助内存+磁盘分层向量引擎、BM25 混合检索、Serverless 弹性与负载强隔离,提供统一数据平面,降低成本并提升检索与分析确定性。
漫画说:为什么你的“增量计算”越跑越慢?——90%的实时数仓团队都踩过的坑,藏在这几格漫画里
Hologres Dynamic Table 采用有状态增量:首次全量持久化聚合/Join 状态,后续仅合并变更,避免反复扫描历史表,刷新由分钟降到秒并降本;分区与 TTL 控制状态膨胀。
Hologres Dynamic Table在淘天价格力的业务实践
淘天价格力用 Hologres Dynamic Table 做数据圈选与近实时报表:基于增量刷新持久化状态,秒级建表并随底表变更更新;分钟级刷新将亿级底表时延从小时降至分钟,Serverless 保障资源隔离。
迅雷基于阿里云 EMR Serverless Spark 实现数仓资源效率与业务提升
迅雷大数据平台原 Hadoop 集群面临性能瓶颈、弹性不足、运维复杂与成本浪费。迁移至阿里云 EMR Serverless Spark 后,实现按需伸缩与归档数据便捷解冻,Kyuubi 提升交互分析效率;TCO 下降,大作业提速约 1 小时,报表稳定 6 点前产出,夜间运维显著减少。
一套底座支撑多场景:高德地图基于 Paimon + StarRocks 轨迹服务实践
高德轨迹数据高实时高并发且需长期存储,按访问跨度做热/温/冷分层:热层 Redis+Lindorm 保障低时延;温冷层 Flink 写入 Paimon、StarRocks 外表查询。配合轨迹聚合、Polyline 压缩、分区裁剪与多集群隔离,在千亿级查询下兼顾性能与成本。
为什么 ES 的搜索结果只到 10,000?强制“数清楚”的代价有多大
ES 7.x 默认只返回 “10000+” 命中数,是为启用 Lucene 的 Block-Max WAND 跳过低分数据块,优先拿到 Top N 结果以提升性能。强制 track_total_hits:true 会迫使遍历并计数所有匹配文档,导致 CPU、I/O 和延迟大幅上升;聚合、排序并取分等场景也会削弱该优化。建议在线搜索用默认/设上限,精确计数仅低频场景使用,可用聚合或近似计数替代。