PAI-Megatron-Patch:灵骏集群训练 LLMs
本书深入探讨了如何利用PAI平台提供的高性能计算资源和优化工具来训练大型语言模型,特别是在分布式集群环境下的高效训练方法。
大数据&AI实战派 第2期
《大数据&AI实战派》系列电子书由阿里云开发者社区与阿里灵杰共同打造,覆盖数据计算、数据分析、数据湖/湖仓一体、机器学习等多个领域,解读各技术领域基础原理,剖析行业实践案例,培养大数据开发者从“生产-采集-存储-分析-开发-治理-价值体现”的技术能力。
俞航翔|基于Log的通用增量Checkpoint
《俞航翔|基于Log的通用增量Checkpoint》本书介绍了Checkpoint性能优化之路,拥有更稳定的Checkpoint,更快速的Checkpoint,更小的端到端延迟,更少的数据回追。
Apache Flink 案例集(2022版)
希望通过本手册,可以让大家了解到大量来自不同领域的公司在数据集成、数据分析、人工智能、云原生以及企业数字化转型等应用场景中使用 Apache Flink 解决实际生产问题的成功案例,其中既包含传统和新兴的互联网公司,也包含通信、证券、银行等传统企业。希望这些生产实践案例和经验能够帮助大家更好的理解和使用 Apache Flink,加速更多企业的实时化平台搭建和业务转型。
《“后红海”时代,独家揭秘当下大数据体系》
《“后红海”时代,独家揭秘当下大数据体系》从系统架构的角度,就大数据架构热点,每条技术线的发展脉络,以及技术趋势和未解问题等方面做一概述。特别的,大数据领域仍然处于发展期,部分技术收敛,但新方向和新领域层出不穷。本文内容和作者个人经历相关,是个人的视角,难免有缺失或者偏颇,同时限于篇幅,也很难全面。仅作抛砖引玉,希望和同业共同探讨。
Apache Flink-实时计算正当时
为了方便用户更快更好更高效的完成业务工作,阿里云开发者社区联合Apache Flink创始团队推出《Apache Flink-实时计算正当时》一书。本书将为开发者们在第一时间 get Apache Flink 1.13 版本新特色和功能提升;同时剖析知乎、腾讯、民生银行、B站等厂商提供 Flink 在多场景中的实战经验,让你轻松 Get 企业大数据服务能力!
阿里巴巴大数据及AI实战
深度剖析淘宝、高德、友盟+、1688、优酷、阿里妈妈、阿里影业大数据实战场景,2020不容错过的企业大数据实战手册。
实时即未来
甄选 Apache Flink 及大数据领域顶级盛会 Flink Forward Asia 大会嘉宾精彩分享,覆盖国内外一线大厂实时平台构建的经验分享与实时数仓的应用实践,为你揭秘实时计算平台从无到有到有、持续优化的详细细节!《Apache Flink 年度最佳实践》首次一次性公布来自B站、美团点评、小米、快手、菜鸟、Lyft、Netflix 等精彩内容,9篇深度文章揭秘一线大厂实时平台构建实践。
UPN512技术架构白皮书(英文版)
随着AI算力超节点的演进,xPU Scale up 系统遇到新的挑战,基于此,阿里云提出UPN(Ultra Performance Network)架构,旨在构建“大规模、高性能、高可靠、低成本、可扩展” 的 Scale up 网络系统,本文阐述UPN512系统的关键架构设计。
FFA2024分论坛-行业解决方案
FFA2024行业解决方案专场由 Apache Flink 核心贡献者与来自中国联通、阿里云、腾讯、中国电信、微财、谙流科技、平凯星辰、飞轮科技等公司的一线技术专家带来分享,探讨Apache Flink在关键行业场景中落地的实时数据驱动决策和分析的方案,通过这些案例,一起解析技术挑战,分享业务成果,促进实时数据处理技术的创新与发展。
FFA2024分论坛-流批一体
FFA 2024 流批一体专场由 Apache Flink 核心贡献者与来自阿里云智能、小米、快手、美团、腾讯及抖音集团公司的一线技术专家聚焦于流批一体的最新进展与实践,涵盖从理论探索到实际应用的全方位内容。围绕构建高效、统一的流批处理架构展开深入探讨。
FFA2024分论坛-核心技术
FFA 2024 核心技术专场由 Apache Flink 核心贡献者与来自阿里云智能、小红书、哔哩哔哩、蚂蚁金服、Shopee等公司的一线技术专家解析 Flink 技术动向与应用实践,重点探讨 Flink 的核心技术(如状态管理、容错机制、数据传输、大规模调度和核心算法等)在实际生产环境中面临的挑战,以及如何通过最佳实践来进行扩展和改进。
开启云上 AIGC 动手实践,探索技术创意
面向 GenAI 时代,阿里云人工智能平台 PAI 平台自带海量开箱即用、实时更新的大模型最佳实践,提供高性能、高稳定的大模型工程化能力。本电子书精选 2024 云栖大会动手实践教程,覆盖大语言模型应用、多模态大模型微调训练、低代码 AIGC 创意设计等热门领域,为您带来 AIGC 开发全新体验。
数据湖技术解析
数据湖无疑是近几年大数据领域最火热的一个方向,那到底什么是数据湖?数据湖的架构和核心技术有哪些?企业应该如何构建、管理和使用数据湖?阿里云开源大数据团队结合在数据湖领域多年的深耕和实战经验,通过本书全方位介绍了从数据湖架构到核心技术到平台构建的内容。
Elastic Stack 实战手册
本书由数十位 Elasticsearch 技术圈的优秀开发者共创而成,得到了许多资深业界精英,社区技术大咖,Elastic Stack 相关书籍作者的支持,凝聚了众多创作人的实践经验和创作能力。 书籍涵盖了一位 Elastic Stack 开发者所需的必要知识,尤其对于刚入门的开发者,从上篇基础的 Elastic Stack 产品能力到下篇的应用实践,提供了系统性学习参考的上手指南。
阿里云实时数仓Hologres技术揭秘2.0
由阿里巴巴多位技术专家精心打磨内容,通过详细的图文介绍,深度剖析实时数仓面临挑战与发展趋势,详细介绍Holologres的技术原理和核心技术优势,并融合多维分析、实时大屏、网络监控、实时数仓等多个热门场景的最佳实践,助力实现服务和分析一体化实时数仓。期望大家在阅读完本书后,能在技术成长的路上更进一步!
EMR StarRocks 白皮书
StarRocks-新一代极速全场景MPP数据仓库产品解决方案。StarRocks 具备⽔平在线扩缩容,⾦融级⾼可⽤,兼容 MySQL 5.7 协议和 MySQL ⽣态,提供全⾯向量化引擎与多种数据源联邦查询等重要特性。StarRocks 致力于在全场景 OLAP 业务上为⽤户提供统⼀的解决⽅案,适⽤于对性能、实时性、并发能⼒和灵活性有较⾼ 要求的各类应⽤场景。
实时数仓Hologres技术实战一本通2.0版(下)
阿里云 10+资深技术专家深度解析,精心打磨内容,手把手教学。 融合实时大屏、实时报表、精细化运营、OLAP 迁移、数据服务等多个场景。8 个板块,20+内容,从零开始,入门到精通,快速助力搭建企业级一站式实时数仓。
阿里云实时计算Flink版解决方案白皮书-2021版
实时计算Flink版是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理平台。为了帮助读者快速掌握实时计算Flink版,阿里云Apache Flink 创始团队特此推出本书。本书详细介绍了实时计算Flink版的产品结构、产品功能及优势。并以结合场景案例的方式在金融、电商、广告等九大行业的应用上给出相应的解决方案供读者学习,帮助读者在实践中学习使用阿里云实时计算 Flink 版。
开源与云:Elasticsearch应用剖析
本书基于【Elasticsearch生态&技术峰会Online】阿里巴巴集团副总裁、Elastic创始人&CEO Shay Bannon等10位资深大咖演讲内容整理而成,对当下热门Elasticsearch技术领域与云生态下开源共生之路的探讨。10大章节,10位大咖,讲透4大技术场景,分享3大云服务应用场景!通过本书,大家能对Elasticsearch开源体系、云原生和数字化转型有更加深刻的了解。
Elasticsearch全观测技术解析与应用(构建日志、指标、APM统一观测平台)
Elasticsearch 是业内比较热门和主流的信息检索分析引擎,在 DB-Engine 指数排行上是全球热度第 7 的数据库。本书将从介绍Elasticsearch、全观测技术原理、行业应用到技术实践,全面系统地解读在大数据背景下,运维人员、开发人员等应用全观测技术的价值和实践上手指南。还有借助阿里云环境进行的 ES 实战演练,详细的图文说明,手把手引导大家系统地使用ES。
《阿里云实时数仓Hologres最佳实践合集》
Hologres是如何支撑阿里巴巴核心技术场景的?最佳实践有哪些?这些问题都可以在本书找到答案!《阿里云原生实时数仓Hologres最佳实践合集》电子书将会首次拆解HSAP核心原理,并介绍其在阿里巴巴双11核心场景落地的最佳实践。本书通过详细的图文介绍,详细介绍Holologres的技术原理和核心技术优势,并介绍Hologres支撑阿里巴巴核心场景的最佳实践。
《实时数仓技术入门一本通》
云原生Hologres作为HSAP服务与分析一体化理念的最佳实践,到底有哪些核心技术优势?Hologres实时数仓原理是什么?又有哪些常见的写入场景?针对传统数据库痛点, Hologres 落地具体业务场景的最佳实践又是什么样的呢?这些问题都可以在本书找到答案!本书通过详细的图文介绍,指导读者搞定融合实时数仓&报表、数据仓库、传统OLAP迁移等10+个实战场景,助力实现服务和分析一体化实时数仓。
《SaaS模式云数据仓库实践手册》
本书的制作目的在于让MaxCompute帮助企业构建全托管的现代化数仓,简化数据洞察、加速价值实现。
“伏羲”神算
阿里巴巴 9 位技术专家为你深度解析阿里巴巴经济体核心调度系统“伏羲”。伏羲(Fuxi)作为十年前最初创立飞天平台时的三大服务之一(分布式存储 Pangu,分布式计算 MaxCompute,分布式调度 Fuxi),十年来,在技术能力上持续演进。本书从面向大数据、云计算的调度挑战出发,介绍伏羲调度系统及各子领域的关键技术进展,并以双11为典型场景进行最佳实践的介绍,为你呈现大数据分布式调度技术的深水区玩法。— 《“伏羲”神算》现在可以免费下载阅读啦,快来先睹为快吧。
Apache Spark 中文实战攻略上册
《Apache Spark 中文实战攻略》上下两册电子书重磅来袭,本书集结国内外顶级大厂技术专家,汇集多年实战经验,带你走进全球顶级开源社区之一 Apache Spark,探秘时下最流行的开源分布式内存式大数据处理引擎。 《Apache Spark 中文实战攻略(上册)》全新收录了Spark+AI Summit 2020 中文精华版峰会,Apache Spark 3.0性能优化与基础实战一书看遍!
大数据工程师必读手册
阿里巴巴如何玩转大数据?十位阿里巴巴大数据专家深度分析 ,飞天大数据平台八款产品最新玩法,2019不容错过的大数据手册——《大数据工程师必读手册》现在可以免费下载阅读啦,赶紧先睹为快吧。
FFA2024分论坛-数据集成
FFA 2024数据集成专场由 Apache Flink 核心贡献者与来自阿里云智能、杭州银行、光大银行、货拉拉、数新智能、镜舟科技等公司的一线技术专家聚焦于实时技术在数据集成场景的价值与发展,讨论实时技术如何提升数据处理的全链路时效性,分析如何基于 Flink 设计实时数据集成框架,以及实时数据集成技术在不同业务领域的最佳实践。
FFA2024分论坛-云原生
FFA2024云原生专场由 Apache Flink 核心贡献者与来自阿里云、网易游戏、小红书、美团、哔哩哔哩等公司的一线技术专家带来,聚焦Flink与云原生技术的结合,探讨如何在云原生环境中高效部署和深度优化Flink流批任务。通过实战经验分享,帮助开发者利用容器化、K8s、Serverless等工具,在稳定、性能、成本之间取得平衡。
FFA2024分论坛-Data+AI
FFA2024Data+AI专场由 Apache Flink 核心贡献者与来自哔哩哔哩、抖音集团、Elastic、京东、硕橙科技等公司的一线技术专家带来,聚焦实时大数据处理与人工智能的前沿融合,共同探讨如何利用Flink助力AI大模型技术的实时化升级,议题涵盖但不限于特征工程、训练、推理、大模型架构优化、以及实时AI大模型在各行业领域的创新应用。
Paimon ✖️ StarRocks,共话实时湖仓架构
8月3日 Streaming Lakehouse Meetup · Online 邀请到了 Apache Paimon PMC ,阿里云,饿了么,喜马拉雅,同程旅行等众多业内大咖,为大家分享 Apache Paimon + StarRocks 在各场景中的最佳实践、生产经验和技术原理。
大数据与机器学习
大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。