大数据&AI产品月刊【2024年9月】

本文涉及的产品
检索分析服务 Elasticsearch 版,2核4GB开发者规格 1个月
实时计算 Flink 版,5000CU*H 3个月
智能开放搜索 OpenSearch行业算法版,1GB 20LCU 1个月
简介: 大数据& AI 产品技术月刊【2024年9月】,涵盖本月技术速递、2024云栖大会实录、产品和功能发布、市场和客户应用实践等内容,帮助您快速了解阿里云大数据& AI 方面最新动态。


一、产品功能发布

人工智能平台 PAI】新功能/规格 - PAI-DSW 内置通义灵码

PAI-DSW 内置智能编码助手通义灵码(个人版),提供行级/函数级实时续写、自然语言生成代码、单元测试生成、代码优化、注释生成、代码解释、研发智能问答、异常报错排查等能力,用户可免安装免登录直接使用,助力开发者高效、流畅地编码。


人工智能平台 PAI】新地域/新可用区 - PAI 训练服务在中国(香港)、印尼(雅加达)开服

分布式训练服务 PAI-DLC、AI 资源配额(Quota)新增开通中国(香港)、印度尼西亚(雅加达)地域,可以支持客户使用资源配额(Quota)和公共资源(按量付费)的提交训练任务。


【人工智能平台 PAI】新功能/规格 - DSW 轻量版(NotebookLab)发布

Notebook 编写环节轻量化,仅需浏览器即可开发,无需预先启动资源;Notebook 资产化,用户 Notebook 和实例资源解耦,更方便的作为技术文档/代码进行沉淀和分享。


【云原生大数据计算服务 MaxCompute】 功能优化 - 控制台包年包月计算 Quota 管理交互界面升级

MaxCompute 控制台 Quota 管理交互升级,提升管理者操作体验。


【实时数仓 Hologres】新功能/规格 - Dynamic Table 正式发布(增量、全量刷新)

可以自动处理并存储一个或者多个基表对象的数据聚合结果,内置增量和全量的刷新策略,实现数据从基表对象到 Dynamic Table 的自动流转,满足业务统一开发、数据自动流转、处理时效性等诉求。


【大数据开发治理平台 DataWorks】新功能/规格 - 智能数据洞察

DataWorks 数据分析支持面向数据表或 SQL 查询结果进行智能数据洞察,智能数据洞察底层通过 AI 算法提供数据计算和推理服务,能够帮助用户在海量数据中提取和探索数据特征和相关性等关键结论,并通过可视化图表和文本描述来直观表达数据见解。


【大数据开发治理平台 DataWorks】新功能/规格 - 新增资产标签管理能力

可对用户管理的表及任务进行标签标记。用户可根据业务逻辑,以 key:value 形式自由定义标签,如“业务场景:财务报表分析”,“资产等级:A0”等,并可针对同一项目或工作空间下表及任务,基于业务视角标记标签值,精细化分类资产。支持用户在数据地图、运维中心中进行标签筛选和标记,提升资产的可发现性。


【开源大数据平台 E-MapReduce】新功能/规格 - 支持 Spark Thrift Server 服务

EMR Serverless Spark 支持 Spark Thrift Server 服务,允许以 JDBC 协议连接并提交任务。


【开源大数据平台 E-MapReduce】新功能/规格 - Serverless Spark 开启商业化

EMR Serverless Spark 是一款云原生,专为大规模数据处理和分析而设计的全托管 Serverless 产品,于2024年9月14日开启商业化。


【开源大数据平台 E-MapReduce】新功能/规格 - Serverless Spark 支持运行环境管理

Notebook 当前已默认安装 matplotlib、numpy 和 pandas。如果您需要使用其他第三方库,可以创建运行环境。当前支持在 Notebook 会话中使用自定义运行环境,Notebook 会话启动时将根据所选环境预装相关库


【开源大数据平台 E-MapReduce】新功能/规格 - Serverless StarRocks 支持物化视图管理

StarRocks 中的物化视图是一种预计算和存储查询结果的机制,其主要目的是加速复杂查询的响应时间。通过将频繁查询或者计算代价高昂的查询结果事先计算好并存储起来,当相同的查询需求再次发生时,可以直接从物化视图中读取数据,从而大幅提高查询效率。本文为您介绍如何使用 EMR StarRocks Manager 查看物化视图。


【开源大数据平台 E-MapReduce】新功能/规格 - Serverless StarRocks 支持阿里云资源组

资源组会对您拥有的云资源从用途、权限和归属等维度上进行分组,实现企业内部多用户、多项目的资源分级管理。一个云资源只能属于一个资源组,云资源之间的关联关系不会因加入资源组而发生变化。EMR Serverless StarRocks 目前支持资源组的云资源为实例。


【数据湖构建】新功能/规格 - DLF2.0开启公测,发布 Paimon Catalog

支持全托管 Paimon 元数据和数据的存储及管理,Paimon 湖表权限管理、Paimon 湖表存储分析和优化,做到元数据统一、湖表格式统一、数据存储统一。集成到阿里云 OpenLake 解决方案,包括 EMR Serverless Spark、EMR Serverless StarRocks、实时计算 Flink版、MaxCompute、Hologres、DataWorks、PAI、OpenSearch 等产品。


二、2024云栖大会实录

AI Native 平台,跨越 AI 应用从创新到生产的鸿沟

云计算带来的应用创新潮,经历了虚拟机时代和云原生时代,正在全面拥抱以大模型为核心的 AI Native 阶段,并推动大数据与 AI 的工作流前所未有地紧密结合。领先大模型、高效的 AI 计算平台和统一的大数据平台是 AI Native 应用广泛落地背后不可获缺的要素。阿里云副总裁、阿里云计算平台事业部负责人汪军华于2024云栖大会技术主论坛宣布阿里云大数据 AI 平台全面升级为 AI Native 应用大爆发提供坚实的平台支撑。


OpenLake 解决方案重磅发布:多模态数据统一纳管、引擎平权联合计算、数据共享统一读写

2024云栖大会上,阿里云 OpenLake 解决方案正式发布。OpenLake 是基于开放可控数据湖仓构建的大数据、搜索、AI 一体化解决方案,能够实现多模态数据统一纳管、多种计算引擎平权计算、大数据AI一体化开发,助力企业基于数据资产构筑竞争力。


PAI:GenAI 时代 AI Infra 工程技术趋势与平台演进

今年是大模型迅猛发展的一年,GenAI(生成式 AI)的应用领域得到了前所未有的拓展。随之而来,技术挑战也在升级,硬件成本、资源管理、软件硬件之间的配合问题等都是大模型落地必须面对的难题。为了应对这些挑战,阿里云人工智能平台 PAI 持续进行技术创新与优化。2024云栖大会 AI Infra 核心技术专场和人工智能平台年度发布专场上,PAI 团队带来了对 AI Infra 工程技术的趋势解读,以及 PAI 的全新能力发布。


MaxCompute:迈向下一代的智能云数仓

阿里云核心自研云原生大数据计算服务 MaxCompute,通过经典数据仓库能力定义与云数据架构的深刻理解,构建出面向下一代智能云数仓。其核心产品理念为:Data+AI,不断深化数据价值,为企业夯实 AI 时代的大数据基础设施;开放湖仓架构,支撑多样数据的融合处理与分析;推出近实时数仓,实现从离线到近实时的系统性能优化;企业级服务化,提供数据的保密性、完整性、可用性保障,支持 AI 智能化在企业级场景下应用。


Hologres 3.0:一体化实时湖仓平台

Hologres 3.0 通过统一数据平台实现湖仓存储一体、多模式计算一体、分析服务一体、Data+AI 一体,发布 Dynamic Table、External Database、分时弹性、Query Queue、NL2SQL 等众多新的产品能力,实现一份数据、一份计算、一份服务,极大提高数据开发及应用效率。同时,Hologres 的预付费实例年付折扣再降15%,仅需7折,不断帮助企业降低数据管理成本,赋能业务增长。


DataWorks:新一代智能湖仓一体数据开发与治理平台

云栖大会商用大数据计算与分析平台专场上,DataWorks 全新升级和推出新一代智能湖仓一体数据开发与治理平台,为 OpenLake 湖仓一体数据架构提供智能化数据集成、数据开发、数据分析与主动式数据资产治理服务,助力“ Data+AI ”全生命周期的数据管理,致力于为用户构建一个开放的云原生数据开发治理平台。


开源大数据平台升级:Native 核心引擎、Serverless 化、湖仓架构引领云上大数据发展

2024云栖大会开源大数据专场带来开源大数据全面升级。实时计算 Flink 推出业界首款向量化流计算引擎- Flash,助力企业在大数据实时化升级的道路上降本增效。开源大数据平台已全面实现了 Serverless 产品化,包括 EMR Serverless Spark、EMR Serverless StarRocks、Serverless 实时计算 Flink 版等。阿里云湖仓架构全面升级,帮助企业快速构建一体化数据分析平台,加速获取 AI 赋能的业务洞察,有效降低数据基础设施与管理成本。


AI 搜索产品:大模型驱动、开源融合

2024年云栖大会- AI 搜索专场带来了 AI 搜索产品的全新升级,一站式 AI 搜索开放平台、高质量开源引擎生态、企业级 AI 搜索应用共同塑造 AI 搜索新纪元。


三、最新活动

技术沙龙 | 搜索进化论:基于大模型的企业级AI搜索

9月13日,阿里云 AI 搜索团队与阿里云用户组联合举办了“搜索进化论:基于大模型的企业级 AI 搜索”主题沙龙。活动特邀阿里云 AI 搜索研发负责人邢少敏等专家带来技术分享,并与企业客户共同探讨 AI 为搜索带来的机遇与挑战,以及 AI 搜索在各应用场景中的实践经验与思考。


开发者活动 | 使用 PAI ArtLab 生成云栖大会打卡 AIGC 写真,记录下您的 APSARA 时刻!

PAI ArtLab 是人工智能平台 PAI 为设计专业人士打造的 AIGC 智能设计工具。通过 PAI Artlab 的 ComfyUI 界面,仅需简单配置,即可生成云栖大会经典场景合照,定格专属的 APSARA 记忆。


开发者活动 | 使用 PAI ✖ LLaMA Factory 微调 Llama3 模型,搭建“ AI 诸葛亮” 问答机器人

使用 PAI 平台及 LLaMA Factory 训练框架完成模型的中文化与角色扮演微调和评估,搭建专属“ AI 诸葛亮”问答机器人,7×24 小时为你出谋划策!


四、产品快讯

首个大数据批流融合国家标准正式发布,阿里云为牵头起草单位!

国家市场监督管理总局、国家标准化管理委员会正式发布大数据领域首个批流融合国家标准 GB/T 44216-2024《信息技术 大数据 批流融合计算技术要求》,该标准由阿里云牵头起草,并将于2025年2月1日起正式实施。


Pai-Megatron-Patch:围绕 Megatron-Core 打造大模型训练加速生态

Pai-Megatron-Patch 是阿里云人工智能平台 PAI 研发的围绕 NVIDIA MegatronLM 的大模型开发配套工具,旨在帮助开发者快速上手大模型,完成大模型(LLM)相关的高效分布式训练,有监督指令微调,下游任务评估等大模型开发链路。最近一年来,我们持续打磨 Pai-Megatron-Patch 的性能和扩展功能,围绕 Megatron-Core 进一步打造大模型训练加速技术生态,推出更多的的训练加速、显存优化特性。


TAG:BladeLLM 的纯异步推理架构

大模型推理社区(vLLM,SGLang 等)普遍开始关注框架运行时开销,提出了多步调度、异步输出处理、独立 API Server 进程等工作,来分摊或掩盖部分开销。在实际业务场景中,也观察到高额的框架开销严重限制了系统吞吐,特别是在高并发(>1k)场景下,运行时开销已经接近或高于 GPU 运行时间,导致资源严重浪费和性能下降。为此,BladeLLM 设计并实现了基于 Python 的纯异步 LLM 推理架构 -- TAG (Totally Asynchronous Generator) ,以最大程度提高 GPU 利用率,提升引擎性能。


五、最佳实践

【最佳实践】RAG 效果优化:高质量文档解析详解

本实践详细介绍基于 AI 开放搜索平台如何将非结构化数据(如 PDF 和 Word 文档)转换为结构化数据,以便于 RAG(Retrieval-Augmented Generation)系统使用。


【最佳实践】阿里云 Elasticsearch AI 搜索实践

ES 在 AI 场景核心技术之一是引入了先进的语义理解能力,特别是通过 embedding 向量技术革新搜索引擎。本文详细介绍阿里云 Elasticsearch AI 搜索方案,基于效果更优的 RAG 全链路模型,加强数据预处理及检索增强能力,支持不同场景的业务应用。


【最佳实践】对接开源大模型应用开发平台最佳实践

本文以 Dify 为例介绍如何使用 OpenSearch LLM 智能问答版对接大模型应用开发平台构建 RAG 系统


【客户案例】阿里云 EMR StarRocks 在七猫的应用和实践

七猫是一家深耕文化娱乐行业的互联网企业,本文详细介绍了阿里云 EMR-StarRocks 助力七猫搭建通用人群圈选系统、指标异动自动下钻探查、730天微聚合数据灵活下钻分析等业务应用与实践。


【Paper Reading】结合 NanoFlow 研究,优化大语言模型服务效率的探索

人工智能平台 PAI 团队开发了 BladeLLM ,旨在为用户提供高性能、高稳定、企业级的大模型推理能力。在日常工作中,我们经常需要处理大量的实时请求,确保用户体验的同时,降低系统的计算成本。正因如此,NanoFlow 中提出的一系列优化策略与我们目前的研究方向紧密相关,探索更高效的模型服务方案提供了启示。本文将深入探讨 NanoFlow 的关键思路和核心技术,分析 NanoFlow 与 阿里云人工智能平台 PAI 在实际工作中应用的潜力。

相关文章
|
23天前
|
弹性计算 人工智能 架构师
阿里云携手Altair共拓云上工业仿真新机遇
2024年9月12日,「2024 Altair 技术大会杭州站」成功召开,阿里云弹性计算产品运营与生态负责人何川,与Altair中国技术总监赵阳在会上联合发布了最新的“云上CAE一体机”。
阿里云携手Altair共拓云上工业仿真新机遇
|
15天前
|
存储 关系型数据库 分布式数据库
GraphRAG:基于PolarDB+通义千问+LangChain的知识图谱+大模型最佳实践
本文介绍了如何使用PolarDB、通义千问和LangChain搭建GraphRAG系统,结合知识图谱和向量检索提升问答质量。通过实例展示了单独使用向量检索和图检索的局限性,并通过图+向量联合搜索增强了问答准确性。PolarDB支持AGE图引擎和pgvector插件,实现图数据和向量数据的统一存储与检索,提升了RAG系统的性能和效果。
|
20天前
|
机器学习/深度学习 算法 大数据
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
2024“华为杯”数学建模竞赛,对ABCDEF每个题进行详细的分析,涵盖风电场功率优化、WLAN网络吞吐量、磁性元件损耗建模、地理环境问题、高速公路应急车道启用和X射线脉冲星建模等多领域问题,解析了问题类型、专业和技能的需要。
2572 22
【BetterBench博士】2024 “华为杯”第二十一届中国研究生数学建模竞赛 选题分析
|
18天前
|
人工智能 IDE 程序员
期盼已久!通义灵码 AI 程序员开启邀测,全流程开发仅用几分钟
在云栖大会上,阿里云云原生应用平台负责人丁宇宣布,「通义灵码」完成全面升级,并正式发布 AI 程序员。
|
3天前
|
JSON 自然语言处理 数据管理
阿里云百炼产品月刊【2024年9月】
阿里云百炼产品月刊【2024年9月】,涵盖本月产品和功能发布、活动,应用实践等内容,帮助您快速了解阿里云百炼产品的最新动态。
阿里云百炼产品月刊【2024年9月】
|
2天前
|
存储 人工智能 搜索推荐
数据治理,是时候打破刻板印象了
瓴羊智能数据建设与治理产品Datapin全面升级,可演进扩展的数据架构体系为企业数据治理预留发展空间,推出敏捷版用以解决企业数据量不大但需构建数据的场景问题,基于大模型打造的DataAgent更是为企业用好数据资产提供了便利。
159 2
|
19天前
|
机器学习/深度学习 算法 数据可视化
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
2024年中国研究生数学建模竞赛C题聚焦磁性元件磁芯损耗建模。题目背景介绍了电能变换技术的发展与应用,强调磁性元件在功率变换器中的重要性。磁芯损耗受多种因素影响,现有模型难以精确预测。题目要求通过数据分析建立高精度磁芯损耗模型。具体任务包括励磁波形分类、修正斯坦麦茨方程、分析影响因素、构建预测模型及优化设计条件。涉及数据预处理、特征提取、机器学习及优化算法等技术。适合电气、材料、计算机等多个专业学生参与。
1570 16
【BetterBench博士】2024年中国研究生数学建模竞赛 C题:数据驱动下磁性元件的磁芯损耗建模 问题分析、数学模型、python 代码
|
21天前
|
编解码 JSON 自然语言处理
通义千问重磅开源Qwen2.5,性能超越Llama
击败Meta,阿里Qwen2.5再登全球开源大模型王座
942 14
|
3天前
|
Linux 虚拟化 开发者
一键将CentOs的yum源更换为国内阿里yum源
一键将CentOs的yum源更换为国内阿里yum源
185 2
|
16天前
|
人工智能 开发框架 Java
重磅发布!AI 驱动的 Java 开发框架:Spring AI Alibaba
随着生成式 AI 的快速发展,基于 AI 开发框架构建 AI 应用的诉求迅速增长,涌现出了包括 LangChain、LlamaIndex 等开发框架,但大部分框架只提供了 Python 语言的实现。但这些开发框架对于国内习惯了 Spring 开发范式的 Java 开发者而言,并非十分友好和丝滑。因此,我们基于 Spring AI 发布并快速演进 Spring AI Alibaba,通过提供一种方便的 API 抽象,帮助 Java 开发者简化 AI 应用的开发。同时,提供了完整的开源配套,包括可观测、网关、消息队列、配置中心等。
711 12