大数据&AI产品月刊【2024年3月】

本文涉及的产品
实时计算 Flink 版,1000CU*H 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
实时数仓Hologres,5000CU*H 100GB 3个月
简介: 大数据&AI产品技术月刊【2024年3月】,涵盖本月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据&AI方面最新动态。



一、产品功能发布


【人工智能平台 PAI】新地域/新可用区-PAI 灵骏智算服务国际站(新加坡区域)正式开服

新增开通国际站新加坡地域。

 

【人工智能平台 PAI】新功能/规格 - DSW支持用户进行AI+大数据开发

帮助客户实现基于notebook的AI+大数据开发一体化体验。

 

【人工智能平台 PAI】新功能/规格 - DSW发布文件中转站功能

DSW新增文件中转站功能,提升用户大文件上传效率。


【人工智能平台 PAI】新地域/新可用区 - PAI 通用计算类型(乌兰察布区域)正式开服

PAI AI计算资源组的通用计算资源在乌兰察布正式开服,用户可以基于通用计算类型算力在PAI平台上实现开发(DSW)、训练(DLC) 等相关功能。


【云原生大数据计算服务 MaxCompute】新功能/规格 - MaxCompute分布式计算框架MaxFrame发布

MaxFrame是由阿里云自研的分布式计算框架,提升Python开发体验


【云原生大数据计算服务 MaxCompute】新功能/规格 - 镜像管理

降低用户镜像、UDF使用及环境准备的成本,提升用户的开发及使用体验。


【云原生大数据计算服务 MaxCompute】新功能/新可用区 - MaxCompute产品在华北6(乌兰察布)正式开服

MaxCompute产品新增开通华北6(乌兰察布),提供企业级Serverless智能数仓服务,可以在控制台上按需求开通。

 

【云原生大数据计算服务 MaxCompute】新功能/规格 - 跨地域灾备邀测发布

MaxCompute提供跨地域(Region)灾备功能,以提升数据安全性。

 

【云原生大数据计算服务 MaxCompute】新功能/规格 - 控制台发布SQL分析

MaxCompute控制台发布SQL分析方便快速体验核心SQL引擎能力。


【云原生大数据计算服务 MaxCompute】新功能/规格 - ECS资源复用版发布

在客户层面提高云上产品资源利用率,降低整体上云成本。


【实时数仓 Hologres】功能优化 - Hologres支持实例级别的SQL诊断

可通过SQL诊断对不同维度的趋势、明细、汇总分析诊断当前实例SQL情况。

 

【大数据开发治理平台 DataWorks】新功能/规格 - 支持将本地CSV或OSS文件上传至MaxCompute

提供了便捷的本地CSV、OSS数据上传功能。

 

【大数据开发治理平台 DataWorks】新功能/规格 - 数据地图新增数据开发代码搜索

数据地图新增数据开发代码搜索功能,支持跨工作空间进行全局代码检索。

 

【大数据开发治理平台 DataWorks】新功能/规格 - 数据服务新增支持实例模式的StarRocks数据源

支持面向StarRocks数据源来快速封装数据API,实现数据共享与开放。

 

【开源大数据平台 E-MapReduce】新功能/新可用区 - StarRocks 在香港和新加坡正式开服

EMR Serverless StarRocks 新增开通香港、新加坡地域,客户可以在控制台上按需求开通集群。

 

【开源大数据平台 E-MapReduce】新功能/规格 - 支持控制台代理创建并管理OSS-HDFS Bucket

在EMR控制台创建集群时,支持代理创建OSS-HDFS Bucket。


【智能开放搜索 OpenSearch】新功能/规格 - 向量检索版控制台支持增删数据

支持客户通过控制台直接增删数据,并实时查看数据状态,提升体验及接入效率。

 

【实时计算 Flink版】新功能/规格 - MongoDB连接器功能优化

表结构变更同步,MongoDB作维表。


【实时计算 Flink版】新功能/规格 - 支持MongoDB Catalog

在Flink作业开发中直接访问MongoDB集合,无需再定义Schema。

 

【实时计算 Flink版】新功能/规格 -Hologres连接器增强

Hologres连接器支持SSL、Bulk Load写入与批量去重。

 

【实时计算 Flink版】新功能/规格 -同城高可用

支持同城灾备能力,确保作业的持续性和高可用性。

 

【实时计算 Flink版】新功能/规格 -免费监控服务

云监控为您提供基础免费监控告警能力。

 

二、产品活动


跟秋葉用PAI实现AI视频生成应用

使用人工智能PAI一键部署,零代码快速部署Stable Video Diffusion模型。


三、产品快讯


【AAAI 2024】再创佳绩!阿里云人工智能平台PAI多篇论文入选

阿里云人工智能平台PAI发表的多篇论文在AAAI-2024上正式亮相发表。AAAI是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。论文成果是阿里云与浙江大学、华南理工大学联合培养项目等共同研发,深耕以通用人工智能(AGI)为目标的一系列基础科学与工程问题,包括多模态理解模型、小样本类增量学习、深度表格学习和文档版面,此次入选意味着阿里云人工智能平台PAI自研的深度学习算法达到了全球业界先进水平,获得了国际学者的认可,展现了阿里云人工智能技术创新在国际上的竞争力。

 

TorchAcc:基于 TorchXLA 的分布式训练框架

阿里云研究员、阿里云人工智能平台 PAI 技术负责人-林伟在GTC 2024 大会 China AI Day 线上中文演讲专场上介绍了TorchAcc。PAI-TorchAcc是阿里云人工智能平台PAI开发的Pytorch上的大模型训练加速框架。PAI-TorchAcc提供了一套基于Pytorch的简洁、易用的接口,无需进行模型转换就可以无缝地接入HuggingFace上的模型,并用多种分布式策略进行训练加速。

 

基于 NVIDIA Megatron-Core 的 MoE LLM 实现和训练优化

阿里云资深算法专家-黄俊在GTC 2024 大会 China AI Day 线上中文演讲专场上介绍了阿里云人工智能平台 PAI 团队与 NVIDIA Megatron-Core 团队在MoE (Mixture of Experts) 大型语言模型(LLM)实现与训练优化上的创新工作。


阿里巴巴将 Flink CDC捐赠给Apache基金会,作为 Apache Flink 的子项目

2024年3月阿里巴巴正式宣布将 Flink CDC项目捐赠给Apache基金会,作为 Apache Flink 的子项目。Flink CDC简化了用户数据集成链路,目前社区 Github star 超过 5 千,用户群破万,技术也在国内外多个行业落地。

 

阿里云 EMR Serverless Spark 版免费邀测中

阿里云EMR Serverless Spark版,以Spark Native Engine为基础,旨在提供一个全托管、一站式的数据开发平台。诚邀您参与EMR Serverless Spark版免费测试,体验 100% 兼容 Spark 的Serverless 服务。

 

阿里云向量检索 Milvus 版开启公测,助力企业打造高质量 AI 服务

阿里云向量检索Milvus版是阿里云提供的Serverless Milvus全托管服务,100% 兼容开源 Milvus,提供高性能、可扩展、大规模 AI 向量数据库相似性检索服务,具备开箱即用、弹性可扩展、全链路监控告警的能力,同时提供开源 Attu 的可视化工具。诚邀广大开发者及企业用户参与公测,赋能智能检索,解锁 AI 潜能。

 

 

四、产品学习指南

【最佳实践】eBPF动手实践系列三:基于原生libbpf库的eBPF编程改进方案

为了简化 eBPF程序的开发流程,降低开发者在使用 libbpf 库时的入门难度,libbpf-bootstrap 框架应运而生,阿里云大数据运维SREWorks团队介绍了基于原生libbpf库的eBPF编程改进方案。

 

【最佳实践】AI大模型运维开发探索第三篇:深入浅出运维智能体

本文将通过HDFS集群诊断向公众展示智能体的真实场景使用,结合大量实践总结,深入浅出分析提示词(Prompt)工程框架中的问题点。其中智能体工程框架进阶思路,可为尝试大模型场景应用的企业提供可参考的经验。

相关实践学习
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
7天前
|
人工智能 分布式计算 Cloud Native
阿里云大数据AI产品月刊-2025年9月
大数据& AI 产品技术月刊【2025年 9 月】,涵盖 9 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
阿里云大数据AI产品月刊-2025年9月
|
12天前
|
人工智能 Cloud Native 算法
拔俗云原生 AI 临床大数据平台:赋能医学科研的开发者实践
AI临床大数据科研平台依托阿里云、腾讯云,打通医疗数据孤岛,提供从数据治理到模型落地的全链路支持。通过联邦学习、弹性算力与安全合规技术,实现跨机构协作与高效训练,助力开发者提升科研效率,推动医学AI创新落地。(238字)
|
26天前
|
存储 人工智能 监控
如何用RAG增强的动态能力与大模型结合打造企业AI产品?
客户的问题往往涉及最新的政策变化、复杂的业务规则,数据量越来越多,而大模型对这些私有知识和上下文信息的理解总是差强人意。
68 2
|
1月前
|
人工智能 分布式计算 DataWorks
阿里云大数据AI产品月刊-2025年8月
阿里云大数据& AI 产品技术月刊【2025年 8 月】,涵盖 8 月技术速递、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。
172 1
|
1月前
|
人工智能 边缘计算 搜索推荐
AI产品测试学习路径全解析:从业务场景到代码实践
本文深入解析AI测试的核心技能与学习路径,涵盖业务理解、模型指标计算与性能测试三大阶段,助力掌握分类、推荐系统、计算机视觉等多场景测试方法,提升AI产品质量保障能力。
|
8天前
|
消息中间件 人工智能 安全
云原生进化论:加速构建 AI 应用
本文将和大家分享过去一年在支持企业构建 AI 应用过程的一些实践和思考。
142 14
|
18天前
|
人工智能 安全 中间件
阿里云 AI 中间件重磅发布,打通 AI 应用落地“最后一公里”
9 月 26 日,2025 云栖大会 AI 中间件:AI 时代的中间件技术演进与创新实践论坛上,阿里云智能集团资深技术专家林清山发表主题演讲《未来已来:下一代 AI 中间件重磅发布,解锁 AI 应用架构新范式》,重磅发布阿里云 AI 中间件,提供面向分布式多 Agent 架构的基座,包括:AgentScope-Java(兼容 Spring AI Alibaba 生态),AI MQ(基于Apache RocketMQ 的 AI 能力升级),AI 网关 Higress,AI 注册与配置中心 Nacos,以及覆盖模型与算力的 AI 可观测体系。
336 18
|
7天前
|
人工智能 算法 Java
Java与AI驱动区块链:构建智能合约与去中心化AI应用
区块链技术和人工智能的融合正在开创去中心化智能应用的新纪元。本文深入探讨如何使用Java构建AI驱动的区块链应用,涵盖智能合约开发、去中心化AI模型训练与推理、数据隐私保护以及通证经济激励等核心主题。我们将完整展示从区块链基础集成、智能合约编写、AI模型上链到去中心化应用(DApp)开发的全流程,为构建下一代可信、透明的智能去中心化系统提供完整技术方案。
101 3
|
7天前
|
存储 人工智能 NoSQL
AI大模型应用实践 八:如何通过RAG数据库实现大模型的私有化定制与优化
RAG技术通过融合外部知识库与大模型,实现知识动态更新与私有化定制,解决大模型知识固化、幻觉及数据安全难题。本文详解RAG原理、数据库选型(向量库、图库、知识图谱、混合架构)及应用场景,助力企业高效构建安全、可解释的智能系统。

相关产品

  • 云原生大数据计算服务 MaxCompute