UPN512技术架构白皮书
随着AI算力超节点的演进,xPU Scale up 系统遇到新的挑战,基于此,阿里云提出UPN(Ultra Performance Network)架构,旨在构建“大规模、高性能、高可靠、低成本、可扩展” 的 Scale up 网络系统,本文阐述UPN512系统的关键架构设计。
全链路数据治理-智能数据建模
DataWorks智能数据建模沉淀阿里巴巴数据中台建模方法论,以维度建模为基础,从数仓规划、数据标准、维度建模、数据指标四个方面,以业务视角对业务的数据进行诠释,让数据仓库的建设向规范化,可持续发展方向演进。 通过本书,你可以学习到: 1. 数据建模理论与规范 2. 菜鸟、大淘系数据建模实践 3. 工业、汽车行业数据建模实践 4. 零售电商数据建模实操案例
阿里云 JindoFS+OSS 数据上云实战
为了帮助读者能更全面地了解 JindoFS,我们特地编撰了这本电子书。从架构到场景到实操,全方面解读jindoFS。
全链路数据治理-全域数据集成
DataWorks全链路数据治理包含智能数据建模、全域数据集成、高效数据开发、主动数据治理、全面数据安全、快速分析服务六大产品能力,覆盖数据的全生命周期。本篇全域数据集成向开发者介绍通过DataWorks数据集成在多表多表、多表到单表、单表到单表等场景下,进行实时或离线同步的技术选型与核心能力,并以MaxCompute与Hologres引擎为例,演示云上数据同步操作步骤最佳实践。
Elasticsearch全观测技术解析与应用(构建日志、指标、APM统一观测平台)
Elasticsearch 是业内比较热门和主流的信息检索分析引擎,在 DB-Engine 指数排行上是全球热度第 7 的数据库。本书将从介绍Elasticsearch、全观测技术原理、行业应用到技术实践,全面系统地解读在大数据背景下,运维人员、开发人员等应用全观测技术的价值和实践上手指南。还有借助阿里云环境进行的 ES 实战演练,详细的图文说明,手把手引导大家系统地使用ES。
EMR StarRocks 白皮书
StarRocks-新一代极速全场景MPP数据仓库产品解决方案。StarRocks 具备⽔平在线扩缩容,⾦融级⾼可⽤,兼容 MySQL 5.7 协议和 MySQL ⽣态,提供全⾯向量化引擎与多种数据源联邦查询等重要特性。StarRocks 致力于在全场景 OLAP 业务上为⽤户提供统⼀的解决⽅案,适⽤于对性能、实时性、并发能⼒和灵活性有较⾼ 要求的各类应⽤场景。
MaxCompute半结构化数据思考与创新
《MaxCompute半结构化数据思考与创新》介绍了半结构化数据模型简析,与传统方案优劣对,MaxCompute思考与实践,以及收益分析。
开启云上 AIGC 动手实践,探索技术创意
面向 GenAI 时代,阿里云人工智能平台 PAI 平台自带海量开箱即用、实时更新的大模型最佳实践,提供高性能、高稳定的大模型工程化能力。本电子书精选 2024 云栖大会动手实践教程,覆盖大语言模型应用、多模态大模型微调训练、低代码 AIGC 创意设计等热门领域,为您带来 AIGC 开发全新体验。
“伏羲”神算
阿里巴巴 9 位技术专家为你深度解析阿里巴巴经济体核心调度系统“伏羲”。伏羲(Fuxi)作为十年前最初创立飞天平台时的三大服务之一,十年来,在技术能力上持续演进。本书从面向大数据、云计算的调度挑战出发,介绍伏羲调度系统及各子领域的关键技术进展,并以双11为典型场景进行最佳实践的介绍,为你呈现大数据分布式调度技术的深水玩法,快来先睹为快吧。
大数据&AI实战派 第2期
《大数据&AI实战派》系列电子书由阿里云开发者社区与阿里灵杰共同打造,覆盖数据计算、数据分析、数据湖/湖仓一体、机器学习等多个领域,解读各技术领域基础原理,剖析行业实践案例,培养大数据开发者从“生产-采集-存储-分析-开发-治理-价值体现”的技术能力。
阿里云实时数仓Hologres技术揭秘2.0
由阿里巴巴多位技术专家精心打磨内容,通过详细的图文介绍,深度剖析实时数仓面临挑战与发展趋势,详细介绍Holologres的技术原理和核心技术优势,并融合多维分析、实时大屏、网络监控、实时数仓等多个热门场景的最佳实践,助力实现服务和分析一体化实时数仓。期望大家在阅读完本书后,能在技术成长的路上更进一步!
UPN512技术架构白皮书(英文版)
随着AI算力超节点的演进,xPU Scale up 系统遇到新的挑战,基于此,阿里云提出UPN(Ultra Performance Network)架构,旨在构建“大规模、高性能、高可靠、低成本、可扩展” 的 Scale up 网络系统,本文阐述UPN512系统的关键架构设计。
基于 Flink SQL + Paimon 构建流式湖仓新方
《基于 Flink SQL + Paimon 构建流式湖仓新方》展示了如何构建新一代流式湖仓体系,以满足低延迟、高并发、强一致性的实时数据分析需求,为数据驱动的决策制定提供强有力的支持。
PAI-Megatron-Patch:灵骏集群训练 LLMs
本书深入探讨了如何利用PAI平台提供的高性能计算资源和优化工具来训练大型语言模型,特别是在分布式集群环境下的高效训练方法。
数字孪生核心技术揭秘
作者专注于数字孪生技术领域,长期担任阿里集团双十一GMV数据大屏、云栖大会指挥中心、城市大脑系列、智慧城市/交通/水利等相关数字孪生大型项目的架构师/PM;本书从一线实战角度出发,对数字孪生应用相关的核心技术如渲染引擎、三维模型资产、地理空间数据、BIM、三维城市智能生成等主题进行了较为深入探讨,比较了各类主流技术的特点与实现成本,为于数字孪生应用的技术选型提供参考价值。
实时数仓Workshop(北京站)- 乐洋
《实时数仓Workshop(北京站)》--阿里云实时计算Flink版产品介绍,2022-9 新版本发布能力介绍。
阿里云云原生一体化数仓新能力解读
云原生一体化数仓是阿里云推出的一站式大数据处理平台,具备流批一体、实时离线一体、湖仓一体、 全链路数据治理四大核心能力。本书将分为离线实时一体、分析服务一体、湖仓一体、数据安全、数据建模、数据治理,六大热门主题,六位大数据专家,带你了解炙手可热的云数据产品最新演进趋势,为大数据开发者讲述一体化数仓的核心产品能力以及在业务中的应用。
开源与云:Elasticsearch应用剖析
本书基于【Elasticsearch生态&技术峰会Online】阿里巴巴集团副总裁、Elastic创始人&CEO Shay Bannon等10位资深大咖演讲内容整理而成,对当下热门Elasticsearch技术领域与云生态下开源共生之路的探讨。10大章节,10位大咖,讲透4大技术场景,分享3大云服务应用场景!通过本书,大家能对Elasticsearch开源体系、云原生和数字化转型有更加深刻的了解。
开源大数据前瞻与应用实战
大数据时代对人类的数据驾驭能力提出了新的挑战,也为人们获得更为深刻、全面的洞察能力提供了前所未有的空间与潜力。作为一线技术骨干,每天沉在业务里,怎样才能快速和时代接轨,让自己不落伍?Flink社区重磅推出2021理论与实战精解系列电子书!《开源大数据前瞻与理论实战》收录了多位大数据领域行业开拓者对未来前沿趋势的洞察,揭秘Apache Flink及开源生态的前沿独家应用!
《实时计算 Flink 版独家实战秘籍》
从结绳记事到量子计算,从飞鸽传书到万物互联,人类文明奔流不息,数字技术变革不止。如今,IT上云与业务互联网化已成必然态势。作为一线开发者,置身于数字化技术变革浪潮之中,如何保持自身核心竞争力,实现技术的积累、进阶与升级?实时计算 Flink 版独家实战秘籍,由阿里巴巴实时计算核心研发团队出品,技术大佬手把手教学,从基础场景解析到进阶任务迁移、demo实操等,9天帮您轻松Get企业级实时计算能力!
Apache Spark 中文实战攻略上册
《Apache Spark 中文实战攻略》上下两册电子书重磅来袭,本书集结国内外顶级大厂技术专家,汇集多年实战经验,带你走进全球顶级开源社区之一 Apache Spark,探秘时下最流行的开源分布式内存式大数据处理引擎。 《Apache Spark 中文实战攻略(上册)》全新收录了Spark+AI Summit 2020 中文精华版峰会,Apache Spark 3.0性能优化与基础实战一书看遍!
零基础入门:从0到1学会 Apache Flink
大数据实时计算及 Apache Flink 年度Flink 年度学习资料大礼包,300+页实战应用精华总结!本书内容包含:1、零基础入门,30 天成长为 Flink 大神的经典教程。2、Apache Flink 核心贡献者及阿里巴巴技术专家的一线实战经验总结。3、收录来自 bilibili、美团点评、小米、OPPO、快手、Lyft、Netflix 等国内外一线大厂实时计算平台及实时数仓最佳实践案例
FFA2024分论坛-流式湖仓
FFA 2024 流式湖仓专场由 Apache Flink 核心贡献者与来自淘天集团、抖音集团、vivo、小米、中原银行、阿里云智能、蚂蚁集团、贝壳找房、货拉拉等公司的一线技术专家解析流批一体、存算分离、湖仓融合的实时湖仓架构,探讨以 Apache Paimon 为流批一体湖存储的湖仓架构建设实践,如何帮助业务获得更实时的数据来驱动业务决策,并实现数据管理的降本增效。
Paimon ✖️ StarRocks,共话实时湖仓架构
8月3日 Streaming Lakehouse Meetup · Online 邀请到了 Apache Paimon PMC ,阿里云,饿了么,喜马拉雅,同程旅行等众多业内大咖,为大家分享 Apache Paimon + StarRocks 在各场景中的最佳实践、生产经验和技术原理。
大数据与机器学习
大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。