一、产品功能发布
【人工智能平台 PAI】新功能/规格 - EAS 全新升级 BladeLLM 高性能部署服务
PAI-EAS 支持 BladeLLM 场景化部署,实现 LLM 推理更快的响应时间和更高的吞吐。
【人工智能平台 PAI】新功能/规格 - EAS 多分布式推理功能发布
EAS 推出多机分布式推理解决方案,突破单一硬件限制,高效支持超大参数模型的部署与运行。
【人工智能平台 PAI】新功能/规格 - EAS 发布 DeepSeek 联网搜索,构建企业级智能助手
EAS 推出基于 PAI-RAG 的 DeepSeek+联网搜索企业级方案,助力客户打造多场景 AI 助理。
【人工智能平台 PAI】功能优化 - DLC 支持训练状态通知
DLC 支持订阅训练状态通知,方便客户追踪训练进程。
【人工智能平台 PAI】新功能/规格 - DLC 支持训练超时告警功能
DLC 支持配置训练超时告警,方便客户监控训练异常。
【人工智能平台 PAI】功能优化 - DLC 提交任务支持直接挂载存储服务
DLC 任务提交支持直接挂载,通用 NAS、极速 NAS、通用 CPFS、智算 CPFS 等多种存储实例。
【人工智能平台 PAI】功能优化 - Ray on DLC 支持使用闲时资源
DLC 使用闲时资源提交 Ray 任务, 实现一份资源运行多种任务,实现算力共享,提升算力利用率。
【人工智能平台 PAI】新功能/规格 - DLC 挂载文件存储支持配置多链接(nconnect)
挂载时支持配置多链接(nconnect), 支持用户对挂载连接数的精细化控制, 优化多节点并发访问性能,确保大规模训练任务稳定性 。
【人工智能平台 PAI】功能优化 - DLC 支持存储服务挂载配置读写权限
训练服务 DLC,挂载存储实例(NAS、 CPFS等)支持配置读写权限,实现权限的精细化管理。
【人工智能平台 PAI】新功能/规格 - AI 调度引擎 v2.0,实现多级任务抢占
任务动态抢占,实现算力共享,提升算力资源利用率。
【人工智能平台 PAI】功能优化 - AI 资源组(专属资源组)订单支持按照节点自动拆分
AI 资源组购买,自动按照购买节点实例拆分订单,方便客户基于节点进行订单的操作和管理。
【人工智能平台 PAI】新功能/规格 - Model Gallery 支持模型推理加速
在模型部署时,帮助客户自动匹配并使用模型推理加速能力,降低推理成本。
【人工智能平台 PAI】新功能/规格 - ArtLab 上线 AIGC 应用专区
PAI-ArtLab 上线 AIGC 应用专区模块,支持用户使用封装了 ComfyUI 工作流的在线应用。
【人工智能平台 PAI】新功能/规格 - ArtLab 上线行业工具能力
为客户带来开箱即用的行业工具,助力客户更好地进行垂类行业的 AIGC 设计。
【云原生大数据计算服务 MaxCompute】新功能/规格 - 管理控制台概览页发布
MaxCompute 管理控制台新增概览页,帮助您快速发现风险与异常,便捷开展运维管理工作。
【云原生大数据计算服务 MaxCompute】新功能/规格 - 交互式查询加速2.0
对标开源 Presto 能力,支持近实时的BI报表/看板和交互式分析等场景。
【云原生大数据计算服务 MaxCompute】新功能/规格 - 自动物化视图(AutoMV)功能发布
MaxCompute 发布 AutoMV,方便帮助客户无感节省计算成本、加速作业执行。
【云原生大数据计算服务 MaxCompute】新功能/规格 - Object Table 功能发布
支持数仓 SQL 引擎访问数据湖存储中非结构化数据的元数据,并通过自定义函数等处理非结构化数据。
【云原生大数据计算服务 MaxCompute】新功能/规格 - 湖仓一体和外部表能力增强
创建外部表解析 PARQUET 格式数据文件时,支持 TINYINT、SMALLINT、DATETIME 等。
【云原生大数据计算服务 MaxCompute】新功能/规格 - 行级权限功能升级
新增支持 Result Cache、物化视图、Local Mode 等场景。
【云原生大数据计算服务 MaxCompute】新功能/规格 - 数据动态脱敏功能发布
提供数据动态脱敏功能,支持掩码、散列、字符替换、数值取整及日期取整等多种脱敏策略。
【云原生大数据计算服务 MaxCompute】新功能/规格 - 近实时场景能力增强
新增 Delta Table 增量表格式 CDC 特性、Stream 数据流对象新特性。
【云原生大数据计算服务 MaxCompute】新功能/规格 - MaxCompute SQL 引擎新版本能力增强
SQL V50新版本上线,数据类型和构造方式增强。
【云原生大数据计算服务 MaxCompute】新功能/规格 - MaxQA 开启公测
MaxQA 旨在实现近实时场景下的查询性能优化,相比之前 MCQA 1.0,性能提升近一倍。
【大数据开发治理平台 DataWorks】新功能/规格 - 数据开发个人开发环境实例支持 GPU 资源及多种关机策略
新版数据开发 Data Studio 中,新建个人开发环境实例时,新增支持选择 GPU 资源类型;个人开发环境实例支持设置指定个人开发环境实例的定时关机,支持管理员设置当前空间下个人开发环境实例触发指定条件后自动关机。
【大数据开发治理平台 DataWorks】新功能/规格 - Copilot 支持 DeepSeek 系列模型
DataWorks Copilot 智能助手接入 DeepSeek 系列模型,包含 DeepSeek 32B模型及671B模型,支持用户在使用 Copilot 的过程中,指定要使用的 DeepSeek 模型进行模型的切换。
【大数据开发治理平台 DataWorks】新功能/规格 - Copilot 支持进行数据质量规则智能推荐
用户可一键唤起 DataWorks Copilot 的数据质量规则推荐功能,通过 Copilot 自动生成数据质量规格的智能推荐,提升数据质量工作效率。
【大数据开发治理平台 DataWorks】新功能/规格 - Copilot 支持对任务进行运维智能诊断
可帮助节省人工诊断时间,任务运维效率进一步提升。
【大数据开发治理平台 DataWorks】新地域/新可用区 - Copilot 新增支持多个 Region
DataWorks Copilot 智能助手新增开通新加坡、马来西亚(吉隆坡)、印度尼西亚(雅加达)和中国香港地域,可以在数据开发 Data Studio 等多个 Copilot 入口唤起使用。
【大数据开发治理平台 DataWorks】新功能/规格 - 数据服务支持面向邮件渠道的数据推送
在 DataWorks 数据服务的数据推送任务或在 Data Studio 的数据推送节点中,新增支持添加邮件正文,并支持选择推送目标为邮箱,从而将数据以附件形式发送至目标邮箱中。
【大数据开发治理平台 DataWorks】新功能/规格 - 运维中心周期任务或实例支持 AI 搜索与自定义视图
运维效率进一步提升。
【大数据开发治理平台 DataWorks】功能优化 - 安全中心权限控制体验持续优化
实体转交支持自定义租户级资源的转交规则,数据访问控制支持批量处理权限申请单,提升使用体验。
【大数据开发治理平台 DataWorks】功能优化 - 数据资产治理新增支持6种研发维检查项
可提供事前检查项开启推荐,方便用户快速进行事前检查。
【实时数仓 Hologres】新功能/规格 - 容灾能力增强,支持3AZ 同城容灾部署
容灾能力增量,产品从单 AZ 部署模式升级为3AZ 同城容灾部署,提升存储和计算的同城容灾能力。
【实时数仓 Hologres】新地域/新可用区 - 新增开通华东2(上海)地域的可用区 L
Hologres 服务新增开通华东2(上海)地域的可用区L,可以按需开通实例。
【开源大数据平台 E-MapReduce】新功能/规格 - 全托管 Spark 正式支持 Spark 3.5.2
对 Fusion、Java Runtime、Paimon 进行优化。
【开源大数据平台 E-MapReduce】新功能/规格 - EMR on ECS 支持创建托管弹性伸缩策略
EMR on ECS 支持创建托管弹性伸缩策略。
【开源大数据平台 E-MapReduce】新功能/规格 - EMR on ECS 支持配置托管弹性伸缩策略
EMR on ECS 支持配置托管弹性伸缩策略。
【智能开放搜索 OpenSearch】新功能/规格 - 向量检索版支持文本与向量混合检索
支持文本向量混合检索,将全文检索与向量检索结合,提升 RAG、语义搜索效果。
【智能开放搜索 OpenSearch】新功能/规格 - 召回引擎版全量数据来源支持数据湖构建(DLF)
全量数据来源支持数据湖构建(DLF),帮助客户基于湖上大规模数据实现检索能力与加速。
【智能开放搜索 OpenSearch】新功能/规格 - LLM 智能问答版支持 DeepSeek-R1系列模型
OpenSearch LLM 智能问答版支持 DeepSeek-R1大模型,提升 RAG 效果,降低使用成本。
【向量检索服务Milvus版】新功能/规格 - 2.5 版本发布
集成开源 Milvus 2.5版本内核,在支持向量检索的基础上,新增支持原生全文检索、基于特定词汇的精准文本匹配等功能,在 RAG、多模态搜索等场景下搜索精度明显提升,1次查询实现文本+向量双精度匹配,使用体验大幅优化。
二、最新活动
开源大数据平台 E-MapReduce Serverless Spark 资源包上线
新增按量付费下的计算资源抵扣包,价格更优惠。首次购买3000CU*小时规格的抵扣包,可享受5折优惠。
EMR Serverless StarRocks 59元资源包上线
新增计算CU资源抵扣包,原价4908元,现新购仅需59元,可抵扣任意规格按量付费的CU消耗。
EMR Serverless Spark 免费试用活动上线,1000 CU*H 免费试用,资源抵扣包有效期3个月。为企业提供了一站式的数据平台服务,包括任务开发、调试、调度和运维等,极大地简化了数据处理的全生命周期工作流程。
新增 Serverless 资源组抵扣包5折起优惠,仅需百元即可体验 Data+AI 一体化开发,可抵扣个人开发环境、数据计算、数据集成、数据服务按量付费的 CU 消耗。
向量检索服务 Milvus 版免费试用活动上线,入门版8 vCPU 32 GiB 免费试用1个月。云原生全托管的向量检索引擎,100%兼容开源 Milvus。能提供超大规模向量数据的相似性检索服务,支持多模态搜索、智能问答&大模型等应用场景。
三、产品快讯
PAI-DSW 全面拥抱 Cloud Native AI,打造一站式云端 AI 开发体验。PAI-DSW 中集成和利用 Fluid 框架,以及通过动态挂载技术实现 OSS 等存储介质上数据集的快速接入和管理。
PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型
DeepSeek 系列模型以其卓越性能在全球范围内备受瞩目,多次评测中表现优异,性能接近甚至超越国际顶尖闭源模型(如 OpenAI 的 GPT-4、Claude-3.5-Sonnet 等)。企业用户和开发者可使用
PAI-Model Gallery 平台一键部署 DeepSeek 系列模型,实现 DeepSeek 系列模型与现有业务的高效融合。
PAI Model Gallery 一键部署阶跃星辰Step-Video-T2V、Step-Audio-Chat 模型
Step-Video-T2V 是一个最先进的 (SoTA) 文本转视频预训练模型,具有 300 亿个参数,能够生成高达 204 帧的视频;Step-Audio 则是行业内首个产品级的开源语音交互模型,通过结合 130B 参数的大语言模型,语音识别模型与语音合成模型,实现了端到端的文本、语音对话生成,能和用户自然地进行高质量对话。PAI Model Gallery 已支持阶跃星辰最新发布的 Step-Video-T2V 文生视频模型与 Step-Audio-Chat 大语言模型的一键部署。
1月15日北京阿里中心,云原生大数据计算服务 MaxCompute 技术专家与众多业内大咖面对面探讨在 Data+AI 融合趋势下,MaxCompute 通过经典数据仓库能力定义与云数据架构的深刻理解,构建出面向下一代智能云数仓,并为用户提供了 Data+AI 一体化开发体验,助力企业高效处理复杂数据需求。
阿里云 MaxCompute MaxQA 开启公测,解锁近实时高效查询体验
云原生大数据计算服务 MaxCompute 推出 MaxQA(原 MCQA2.0)查询加速功能,在独享的查询加速资源池的基础上,对管控链路、查询优化器、执行引擎、存储引擎以及缓存机制等多个环节进行全面优化,显著减少了查询响应时间,适用于 BI 场景、交互式分析以及近实时数仓等对延迟要求高且稳定的场景。现正式开启公测,欢迎广大开发者及企业用户参与,解锁高效查询体验!
阿里云大数据开发治理平台 DataWorks 接入 DeepSeek 系列模型
阿里云 DataWorks 正式接入 DeepSeek-R1(671B)与 DeepSeek-R1-Distill-Qwen-32B大模型。此举显著提升平台的数据处理、分析和治理能力,简化数据开发流程,并支持智能数据查询、自动化报告生成等应用场景,推动企业级数据治理智能化进程,助力企业实现数据驱动的创新发展。
大数据 AI 一体化开发再加速:DataWorks 支持 GPU 类型资源
DataWorks 一站式智能数据开发治理平台,通过支持 GPU 资源,打破“大数据+AI ”融合瓶颈,实现一站式数据开发与 AI 模型训练。开发者可同一平台轻松高效地进行数据处理、数据探索、数据可视化和模型构建,无需跨平台迁移数据。
Flink + Paimon + Hologres,面向未来的一体化实时湖仓平台架构设计
Flink + Paimon + Hologres 一体化实时湖仓平台架构设计。第三代架构通过 Hologres 与 Flink 的深度集成,解决了数据复用和运维难题,实现了高性能的实时写入、查询和更新。Hologres 3.0引入 External Database 和 Dynamic Table 等特性,优化了资源使用和成本控制,已在多个业务场景中成功应用,显著提升了开发效率并降低了成本。
阿里云 EMR 发布托管弹性伸缩功能,支持自动调整集群大小,最高降本60%
阿里云开源大数据平台 E-MapReduce 推出托管弹性伸缩功能,结合 ECS 容器化部署优势,实现灵活配置与管理 EMR 集群。该功能支持根据业务需求自动调整计算能力,用户仅需设定最小和最大 Task 节点数,EMR 会依据工作负载关键指标自动调整集群规模,确保最佳性能与资源利用率。
阿里云 Elasticsearch Serverless 相较于基于 ECS 自建 Elasticsearch 集群的成本与性能优势,通过 Serverless 架构实现高达 70%以上的成本节约。
从企业级 RAG 到 AI Assistant,阿里云 Elasticsearch AI 搜索技术实践
阿里云 Elasticsearch 推出的创新型 AI 搜索方案,使用 RAG 技术对检索增强生成的各个环节进行能力增强,并深度融合了企业版 AI Assistant,将 RAG 技术应用于 AI Ops 领域。
OpenSearch LLM 智能问答版基于 Deepseek-R1 一分钟搭建 RAG 系统
OpenSearch LLM 智能问答版已集成 DeepSeek-R1系列模型,进一步提升企业级 RAG 效果。
AI 搜索开放平台 × DeepSeek,面向企业及开发者的首选解决方案
阿里云 AI 搜索开放平台面向企业及开发者提供丰富的 AI 搜索组件化服务,用户可灵活调用多模态数据解析、大语言模型、效果测评等数十个服务。基于AI搜索开放平台快速体验 DeepSeek-R1 模型,单次调用低至平均1分钱。
四、最佳实践
以人工智能平台 PAI 为例,为您介绍在云上使用一站式白盒化大模型应用开发平台 PAI-LangStudio 构建面向教育场景的大模型 RAG 检索增强解决方案,应用构建更简便,开发环境更直观。此外,PAI 平台同样发布了面向医疗、金融和法律领域的 RAG 解决方案。
以人工智能平台 PAI 为例,为您介绍在云上使用一站式白盒化大模型应用开发平台 PAI-LangStudio 构建面向法律场景的大模型 RAG 检索增强解决方案,应用构建更简便,开发环境更直观。此外,PAI 平台同样发布了面向医疗、金融和教育领域的 RAG 解决方案。
云上玩转 DeepSeek 系列之一:PAI Model Gallery 支持云上一键部署 DeepSeek-V3、DeepSeek-R1 系列模型
DeepSeek 系列模型以其卓越性能在全球范围内备受瞩目,多次评测中表现优异,性能接近甚至超越国际顶尖闭源模型。企业用户和开发者可使用 PAI 平台一键部署 DeepSeek 系列模型,实现 DeepSeek 系列模型与现有业务的高效融合。
云上玩转 DeepSeek 系列之二:PAI+DeepSeek,打造智能问答助手
“PAI+DeepSeek,30分钟打造支持连网搜索+私有知识库的智能应用”最佳实践,大模型能力、联网能力再加持 RAG 方案,实现 DeepSeek 系列模型与现有业务的高效融合。
云上玩转 DeepSeek 系列之三:PAI-RAG 集成联网搜索,构建企业级智能助手
基于 PAI-RAG 构建 DeepSeek 联网搜索+企业级知识库助手服务”解决方案,PAI-RAG 提供全面的生态能力,支持一键部署至企业微信、微信公众号、钉钉群聊机器人等,助力打造多场景的AI助理,全面提升业务效率与用户体验。
云上玩转 DeepSeek 系列之四:DeepSeek R1 蒸馏和微调训练最佳实践
“DeepSeek R1+Qwen 大模型蒸馏和微调训练”最佳实践。阿里云 PAI 平台提供了围绕 DeepSeek 模型的最佳实践,涵盖快速部署、应用搭建、蒸馏和微调等环节,帮助开发者高效利用计算资源,使用 Model Gallery 功能,轻松完成部署与微调任务。
云上玩转 DeepSeek 系列之五:实测优化16%, 体验 FlashMLA 加速 DeepSeek-V2-Lite 推理
DeepSeek-AI 开源的 FlashMLA 是一个优化多层注意力机制的解码内核,显著提升大语言模型的长序列处理和推理效率。本文介绍了如何在 PAI 平台上安装并使用 FlashMLA 部署 DeepSeek-V2-Lite-Chat 模型。通过优化后的 FlashMLA,实现了约 16% 的性能提升。
阿里云视频生成大模型万相2.1(Wan)重磅开源!Wan2.1 在处理复杂运动、还原真实物理规律、提升影视质感以及优化指令遵循方面具有显著的优势,轻松实现高质量的视频生成。同时,万相还支持业内领先的中英文文字特效生成,满足广告、短视频等领域的创意需求。阿里云人工智能平台 PAI-Model Gallery 现已经支持一键部署阿里万相重磅开源的4个模型,可获得您的专属阿里万相服务。
蚂蚁基于 MaxCompute 动态过滤器优化小表 JOIN 大表节省70%CPU 消耗
MaxCompute 作为阿里自主研发的分布式大数据处理平台,广泛应用于集团内部多个核心业务。在蚂蚁商家账单离线产出时效提升项目中,通过 MaxCompute 产品提供的动态过滤器结合 Hash Clustering 表能力,在小表 JOIN 大表的场景下实现将在 JOIN 前尽可能多的过滤数据,减少了95%以上大表被扫描到的文件数,并大幅度提升 SQL 运行速度,最终减少了70%的 CPU 消耗和磁盘 IO 量。
MaxCompute x DataWorks × DeepSeek,实现使用自定义数据集微调DeepSeek-R1蒸馏模型
基于阿里云云原生大数据计算服务 MaxCompute 以及大数据治理开发平台 Dataworks 实现使用自定义数据集微调 DeepSeek-R1 蒸馏模型,通过这一过程能够简化模型微调和数据集构建的过程,提高开发效率。
使用 DataWorks Notebook 实现 Kaggle 竞赛之房价预测,成为数据分析大神!
本文以 Kaggle 竞赛中的房价预测为例,结合 DataWorks Notebook,完成数据加载、数据探索、数据可视化、数据清洗、特征分析、特征处理、机器学习、回归预测等步骤,主要 Python 工具是 Pandas 和 SKLearn。
阿里云 EMR Serverless Spark 在微财机器学习场景下的应用
微财是一家创新型的金融科技企业,为客户提供消费分期等金融信息服务。阿里云 EMR Serverless Spark 作为一站式全托管湖仓分析平台,自研 Fusion 引擎,内置高性能向量化计算和 RSS 能力,统一的数据工程和数据科学,案例详细介绍了阿里云 EMR Serverless Spark 在微财机器学习场景下的应用。
美的楼宇科技基于阿里云 EMR Serverless Spark 构建 LakeHouse 湖仓数据平台
美的楼宇科技基于阿里云 EMR Serverless Spark 建设 IoT 数据湖仓平台,实现了数据与 AI 技术的有效融合,解决了美的楼宇科技设备数据量庞大且持续增长、数据半结构化、数据价值缺乏深度挖掘的痛点问题。整体性能提升50%,综合成本下降30%,基于 Spark 全生态推动 Data+AI 落地。
用友畅捷通随着数据量增长,公司面临数据库性能瓶颈及实时数据处理需求,通过引入 Flink 技术逐步解决了数据同步、链路稳定性和表结构差异等问题,并计划在未来进一步优化链路稳定性、探索湖仓一体架构以及结合 AI 技术推进数据资源高效利用。
Elasticsearch AI Assistant 集成 DeepSeek,1 分钟搭建智能运维助手
Elasticsearch 新支持 DeepSeek 系列模型,使用 AI 助手,通过自然语言交互,为可观测性分析、安全运维管理及数据智能处理提供一站式解决方案。
Elasticsearch:使用阿里云 AI 服务进行向量化和重新排名
阿里云 AI 功能与 Elasticsearch 集成,以提高语义搜索的相关性。阿里云人工智能搜索是一种将高级人工智能功能与 Elasticsearch 工具相结合的解决方案,利用 Qwen LLM/DeepSeek-R1 系列提供高级推理和分类模型。我们将使用同一作者撰写的小说和戏剧的描述来测试阿里巴巴重新排名和稀疏嵌入端点。
Milvus x DeepSeek 搭建低成本高精度 RAG 实战
基于阿里云 Milvus+DeepSeek + PAI LangStudio 低成本搭建高精度的 RAG(检索增强生成)系统。开发者可以搭建一个支持私域知识库和联网功能的智能问答助手,助力企业应对数据管理和业务挑战。