阿里云大数据 AI 产品月刊-2026年1月

简介: 阿里云大数据& AI 产品技术月刊【2026年1月】,涵盖1月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。

阿里云大数据& AI 产品技术月刊【2026年1月】,涵盖1月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。


一、产品功能发布

人工智能平台 PAI - KV Store全局上下文缓存发布

EAS部署LLM服务的过程中支持配置KV Store的全局上线文缓存,通过GPU→内存→Redis kv metadata的多级存储查询来提升kvcache命中率,提升LLM推理吞吐性能。


人工智能平台 PAI - PAI智能助手诊断二期:支持DLC任务、EAS服务诊断

PAI智能助手(小PAI)智能诊断能力升级 1.降低AI工程门槛 2.提升资源使用效率 3.保障业务连续性 4. 知识沉淀与复用。


人工智能平台 PAI - 推理服务资源诊断发布

EAS 针对多机多卡的分布式服务实例单元以及普通服务实例,提供资源配额(quota)和优先级排队的诊断能力,帮助客户快速定位资源相关问题。


人工智能平台 PAI - AutoML 开服通知

AutoML在新加坡正式开服。


人工智能平台 PAI - DLC联合训练发布模型保护策略功能

PAI DLC 支持模型提供方在平台设定策略参数显式声明是否允许基于该数据产出的联合模型被导出,实现“数据使用即授权、模型产出可管控”的端到端隐私与知识产权保护机制,兼顾协作效率与合规安全。


人工智能平台 PAI - DLC发布vcpu算力分级功能

PAI 在智算场景,支持将算力CPU按照vcpu性能分为高、中和低等级,训练任务按照负载特点选择不同性能等级的vcpu,实现计算差异化使用,从而提升整体计算性能,预计提升计算性能 10%~30%


云原生大数据计算服务 MaxCompute - MaxFrame新增Embedding等预设大模型推理接口

MaxFrame AI Function 新增提供translate(翻译)、extract(结构化抽取)、embedding(向量化) 等预设标准化任务接口,可直接调用大模型推理能力


云原生大数据计算服务 MaxCompute - MaxFrame 新增 DLF Paimon 读写支持

MaxFrame 新增对 MC External Project 管理的 DLF Paimon 表读写支持


实时数仓 Hologres - 全文检索支持IK、Ngram、拼音分词器

全文检索支持IK、Ngram、拼音分词器,更广泛应用于中文描述类文本、日志类文本、中文商品/人名拼音等检索场景


实时数仓 Hologres - 自适应Serverless计算能力增强

自适应Serverless计算能力增强,支持自动负载隔离,负载高时自动切流至Serverless Computing资源池,显著提升系统吞吐能力与稳定性


实时数仓 Hologres - 表结构变更(Rebuild)能力增强

Rebuild能力增强,表结构变更过程中的写入受影响时长缩短至 10 秒以内,执行期间表可以正常查询


开源大数据平台 E-MapReduce - 全托管Spark支持纳管文件目录

  • 新增支持纳管NAS文件目录,挂载纳管NAS文件目录后,用户可以在Notebook、数据开发任务中对纳管文件目录中的文件进行读写操作。
  • 单个工作空间新增支持纳管多个文件目录。
  • 纳管文件目录支持挂载至 Spark Executor,挂载后所有Executor可以以本地路径访问挂载文件。


开源大数据平台 E-MapReduce - 全托管Spark支持按量转包年包月

支持按照队列粒度按量转包年包月,灵活满足业务需求。


开源大数据平台 E-MapReduce - 全托管Spark支持数据目录

数据目录添加 DLF Catalog 后,原生支持使用Catalog下所有格式的表,如 Paimon Table 和 Iceberg Table。


检索分析服务 Elasticsearch版 - 乌兰察布行业合规云售卖发布

开放区域:华北6(乌兰察布行业合规云)。


检索分析服务 Elasticsearch版 - 国际站发布

墨西哥Region国际站发布。


智能开放搜索 OpenSearch - 行业算法版支持OBJECT和NESTED两种复合数据类

行业算法版支持OBJECT和NESTED两种复合数据类型,允许将多个字段组合在一起,形成嵌套结构。正确使用复合数据类型,能提升查询准确性,避免错误匹配,让复杂数据管理更高效。


智能开放搜索 OpenSearch - 新增人脸多模态向量模型与人脸主体识别模型

提供多模态向量和主体识别服务中的人脸检测与向量化模型,提升视频检索效果。


向量检索服务 Milvus 版 - 支持平滑数据迁移能力

一键支持从开源 Milvus 自建集群、Zilliz Cloud 以及阿里云 Milvus 实例(不同版本)平滑迁移至阿里云 Milvus。


向量检索服务 Milvus 版 - 支持同城多可用区容灾能力

支持在双可用区基础版和高可用版实例间构建同城容灾能力,显著提升整体服务的容灾等级和可靠性。


向量检索服务 Milvus 版 - 支持 OSS 数据加密能力

支持用户在新购时配置自定义 KMS 密钥对底层 OSS 数据进行加密存储,实现数据全链路加密保护。满足金融、政企等对数据安全与合规性的高级要求,降低敏感数据泄露风险。


向量检索服务 Milvus 版 - 购买页全新升级

简化创建流程并降低选型成本,带来更顺畅直观的采购与开通体验。


二、产品快讯

Agentic Search: AI驱动的下一代企业搜索

Agentic Search 是 OpenSearch 升级的企业 AI 搜索:以 Agent 将搜索、推理、规划与工具调用融合,形成“理解-规划-执行-反馈”闭环,从找文档进化为交付结果。提供对话/规划/自适应三模式,支持多模态解析、企业知识库 RAG、代码执行、联网搜索与爬虫等,并可输出 Markdown/HTML 报告,覆盖深度研究、智能客服与企业提效场景。


万字实战沉淀,阿里云Hologres首发《Serverless OLAP 技术白皮书》

传统 OLAP 因存算一体与静态规划,低谷期也需全量在线,资源利用率低、成本与运维压力大。Hologres 提出 Serverless OLAP “Down to Zero”:按需秒级弹性、闲时降至零、强隔离与免运维,只为实际算力付费;通过共享弹性资源池、自动路由与纯 Serverless 实例实现。


EMR AI 助手再升级:支持 Serverless StarRocks

EMR AI 助手公测新增支持 Serverless StarRocks,面向参数调优、慢查询治理与异常排查等高门槛运维场景,提供智能对话、异常诊断和优化建议三大能力,可自然语言查询实例/SQL 状态、定位 CPU/内存/磁盘/超时等问题并给出修复与索引分区物化视图及参数调优建议;已在多区域开放体验。


Data+AI全面升级,阿里云OpenLake解决方案重磅更新

阿里云 OpenLake 方案升级:DLF 3.0 商业化实现全模态数据统一管理(Paimon 托管并兼容 Iceberg 等),统一元数据支持 PAI、MaxCompute、Hologres、Flink、EMR、ES、Milvus 等多引擎协同,一份数据多处计算。推出流存储 Fluss 公测,打通湖流一体将数据新鲜度提升到秒级、成本降 10 倍;EMR Serverless StarRocks 读写 Paimon 提升 100%,EMR Serverless Spark 全面支持 Spark 4.0 强化全模态预处理。


三、最佳实践

面向Interleaved Thinking的大模型Agent蒸馏实践

阿里云 PAI 基于 ReAct 交错思维构建多轮轨迹数据,提出“行为克隆 + 教师纠错”蒸馏流程,在 EasyDistill 框架实现一键生成轨迹并训练轻量 Agent。评测显示小模型在数学推理、多跳问答与 Deep Search 等需工具调用任务上稳定性与成功率显著提升,7B/8B 可接近甚至超过更大模型表现。


阿里云携手模思智能构建一站式多模态数据处理平台

阿里云与模思智能基于 MaxCompute 构建一站式多模态数据处理平台,借助 MaxFrame 分布式引擎与 DataWorks 编排,实现音视频等非结构化数据在 OSS 上统一存储、Object Table 自动采集元数据并纳管,支持异构算力协同调度与稳定高并发处理。落地后峰值可扩展至数万核,资源利用率提升 30%+,预处理性能提升 100%,运维投入减少 50%。


AI时代最大的宝藏,也藏得最深:80%的企业知识沉睡在非结构化数据中

AI 时代企业 80% 知识沉睡在非结构化数据中,数据熵导致 RAG/Agent 易出错。Hologres 推出 HSAP 2.0 将向量/全文检索与 OLAP 原生融合,借助内存+磁盘分层向量引擎、BM25 混合检索、Serverless 弹性与负载强隔离,提供统一数据平面,降低成本并提升检索与分析确定性。


漫画说:为什么你的“增量计算”越跑越慢?——90%的实时数仓团队都踩过的坑,藏在这几格漫画里

Hologres Dynamic Table 采用有状态增量:首次全量持久化聚合/Join 状态,后续仅合并变更,避免反复扫描历史表,刷新由分钟降到秒并降本;分区与 TTL 控制状态膨胀。


Hologres Dynamic Table在淘天价格力的业务实践

淘天价格力用 Hologres Dynamic Table 做数据圈选与近实时报表:基于增量刷新持久化状态,秒级建表并随底表变更更新;分钟级刷新将亿级底表时延从小时降至分钟,Serverless 保障资源隔离。


迅雷基于阿里云 EMR Serverless Spark 实现数仓资源效率与业务提升

迅雷大数据平台原 Hadoop 集群面临性能瓶颈、弹性不足、运维复杂与成本浪费。迁移至阿里云 EMR Serverless Spark 后,实现按需伸缩与归档数据便捷解冻,Kyuubi 提升交互分析效率;TCO 下降,大作业提速约 1 小时,报表稳定 6 点前产出,夜间运维显著减少。


一套底座支撑多场景:高德地图基于 Paimon + StarRocks 轨迹服务实践

高德轨迹数据高实时高并发且需长期存储,按访问跨度做热/温/冷分层:热层 Redis+Lindorm 保障低时延;温冷层 Flink 写入 Paimon、StarRocks 外表查询。配合轨迹聚合、Polyline 压缩、分区裁剪与多集群隔离,在千亿级查询下兼顾性能与成本。


为什么 ES 的搜索结果只到 10,000?强制“数清楚”的代价有多大

ES 7.x 默认只返回 “10000+” 命中数,是为启用 Lucene 的 Block-Max WAND 跳过低分数据块,优先拿到 Top N 结果以提升性能。强制 track_total_hits:true 会迫使遍历并计数所有匹配文档,导致 CPU、I/O 和延迟大幅上升;聚合、排序并取分等场景也会削弱该优化。建议在线搜索用默认/设上限,精确计数仅低频场景使用,可用聚合或近似计数替代。

相关文章
|
14天前
|
人工智能 自然语言处理 Shell
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
本教程指导用户在开源AI助手Clawdbot中集成阿里云百炼API,涵盖安装Clawdbot、获取百炼API Key、配置环境变量与模型参数、验证调用等完整流程,支持Qwen3-max thinking (Qwen3-Max-2026-01-23)/Qwen - Plus等主流模型,助力本地化智能自动化。
27905 100
🦞 如何在 OpenClaw (Clawdbot/Moltbot) 配置阿里云百炼 API
|
9天前
|
人工智能 安全 机器人
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
OpenClaw(原Clawdbot)是一款开源本地AI助手,支持钉钉、飞书等多平台接入。本教程手把手指导Linux下部署与钉钉机器人对接,涵盖环境配置、模型选择(如Qwen)、权限设置及调试,助你快速打造私有、安全、高权限的专属AI助理。(239字)
5300 14
OpenClaw(原 Clawdbot)钉钉对接保姆级教程 手把手教你打造自己的 AI 助手
|
8天前
|
人工智能 机器人 Linux
OpenClaw(Clawdbot、Moltbot)汉化版部署教程指南(零门槛)
OpenClaw作为2026年GitHub上增长最快的开源项目之一,一周内Stars从7800飙升至12万+,其核心优势在于打破传统聊天机器人的局限,能真正执行读写文件、运行脚本、浏览器自动化等实操任务。但原版全英文界面对中文用户存在上手门槛,汉化版通过覆盖命令行(CLI)与网页控制台(Dashboard)核心模块,解决了语言障碍,同时保持与官方版本的实时同步,确保新功能最快1小时内可用。本文将详细拆解汉化版OpenClaw的搭建流程,涵盖本地安装、Docker部署、服务器远程访问等场景,同时提供环境适配、问题排查与国内应用集成方案,助力中文用户高效搭建专属AI助手。
3821 8
|
10天前
|
人工智能 机器人 Linux
保姆级 OpenClaw (原 Clawdbot)飞书对接教程 手把手教你搭建 AI 助手
OpenClaw(原Clawdbot)是一款开源本地AI智能体,支持飞书等多平台对接。本教程手把手教你Linux下部署,实现数据私有、系统控制、网页浏览与代码编写,全程保姆级操作,240字内搞定专属AI助手搭建!
5066 17
保姆级 OpenClaw (原 Clawdbot)飞书对接教程 手把手教你搭建 AI 助手
|
3天前
|
应用服务中间件 API 网络安全
3分钟汉化OpenClaw,使用Docker快速部署启动OpenClaw(Clawdbot)教程
2026年全新推出的OpenClaw汉化版,是基于Claude API开发的智能对话系统本土化优化版本,解决了原版英文界面的使用壁垒,实现了界面、文档、指令的全中文适配。该版本采用Docker容器化部署方案,开箱即用,支持Linux、macOS、Windows全平台运行,适配个人、企业、生产等多种使用场景,同时具备灵活的配置选项和强大的扩展能力。本文将从项目简介、部署前准备、快速部署、详细配置、问题排查、监控维护等方面,提供完整的部署与使用指南,文中包含实操代码命令,确保不同技术水平的用户都能快速落地使用。
2242 0
|
10天前
|
存储 人工智能 机器人
OpenClaw是什么?阿里云OpenClaw(原Clawdbot/Moltbot)一键部署官方教程参考
OpenClaw是什么?OpenClaw(原Clawdbot/Moltbot)是一款实用的个人AI助理,能够24小时响应指令并执行任务,如处理文件、查询信息、自动化协同等。阿里云推出的OpenClaw一键部署方案,简化了复杂配置流程,用户无需专业技术储备,即可快速在轻量应用服务器上启用该服务,打造专属AI助理。本文将详细拆解部署全流程、进阶功能配置及常见问题解决方案,确保不改变原意且无营销表述。
5480 5
|
12天前
|
人工智能 JavaScript 应用服务中间件
零门槛部署本地AI助手:Windows系统Moltbot(Clawdbot)保姆级教程
Moltbot(原Clawdbot)是一款功能全面的智能体AI助手,不仅能通过聊天互动响应需求,还具备“动手”和“跑腿”能力——“手”可读写本地文件、执行代码、操控命令行,“脚”能联网搜索、访问网页并分析内容,“大脑”则可接入Qwen、OpenAI等云端API,或利用本地GPU运行模型。本教程专为Windows系统用户打造,从环境搭建到问题排查,详细拆解全流程,即使无技术基础也能顺利部署本地AI助理。
7419 16
|
12天前
|
人工智能 JavaScript API
零门槛部署本地 AI 助手:Clawdbot/Meltbot 部署深度保姆级教程
Clawdbot(Moltbot)是一款智能体AI助手,具备“手”(读写文件、执行代码)、“脚”(联网搜索、分析网页)和“脑”(接入Qwen/OpenAI等API或本地GPU模型)。本指南详解Windows下从Node.js环境搭建、一键安装到Token配置的全流程,助你快速部署本地AI助理。(239字)
5039 22