FFA2024分论坛-流式湖仓
FFA 2024 流式湖仓专场由 Apache Flink 核心贡献者与来自淘天集团、抖音集团、vivo、小米、中原银行、阿里云智能、蚂蚁集团、贝壳找房、货拉拉等公司的一线技术专家解析流批一体、存算分离、湖仓融合的实时湖仓架构,探讨以 Apache Paimon 为流批一体湖存储的湖仓架构建设实践,如何帮助业务获得更实时的数据来驱动业务决策,并实现数据管理的降本增效。
FFA2024分论坛-核心技术
FFA 2024 核心技术专场由 Apache Flink 核心贡献者与来自阿里云智能、小红书、哔哩哔哩、蚂蚁金服、Shopee等公司的一线技术专家解析 Flink 技术动向与应用实践,重点探讨 Flink 的核心技术(如状态管理、容错机制、数据传输、大规模调度和核心算法等)在实际生产环境中面临的挑战,以及如何通过最佳实践来进行扩展和改进。
FFA2024分论坛-生产实践
FFA 2024生产实践专场由 Apache Flink 核心贡献者与来自快手、eBay、阿里云、抖音集团、Uber、鹰角、移动云、京东、用友畅捷通、搜配云、度小满、天翼云等公司的一线技术专家带来,将聚焦于在生产中使用和部署Flink的痛点, 经验以及最佳实践, 共同探讨如何在真实环境中更高效, 安全, 敏捷地落地实时数据处理框架。
Elasticsearch全观测技术解析与应用(构建日志、指标、APM统一观测平台)
Elasticsearch 是业内比较热门和主流的信息检索分析引擎,在 DB-Engine 指数排行上是全球热度第 7 的数据库。本书将从介绍Elasticsearch、全观测技术原理、行业应用到技术实践,全面系统地解读在大数据背景下,运维人员、开发人员等应用全观测技术的价值和实践上手指南。还有借助阿里云环境进行的 ES 实战演练,详细的图文说明,手把手引导大家系统地使用ES。
开启云上 AIGC 动手实践,探索技术创意
面向 GenAI 时代,阿里云人工智能平台 PAI 平台自带海量开箱即用、实时更新的大模型最佳实践,提供高性能、高稳定的大模型工程化能力。本电子书精选 2024 云栖大会动手实践教程,覆盖大语言模型应用、多模态大模型微调训练、低代码 AIGC 创意设计等热门领域,为您带来 AIGC 开发全新体验。
全链路数据治理-智能数据建模
DataWorks智能数据建模沉淀阿里巴巴数据中台建模方法论,以维度建模为基础,从数仓规划、数据标准、维度建模、数据指标四个方面,以业务视角对业务的数据进行诠释,让数据仓库的建设向规范化,可持续发展方向演进。 通过本书,你可以学习到: 1. 数据建模理论与规范 2. 菜鸟、大淘系数据建模实践 3. 工业、汽车行业数据建模实践 4. 零售电商数据建模实操案例
面向Web应用的三维建模实战
得益于游戏产业的发展,目前主流桌面端三维引擎如UE、Unity等三维模型的工作流非常成熟;但是Web端的三维模型开发却面临工作流混乱、规范缺失、人才匮乏等挑战,阻碍了三维模型Web应用的推广。Blender是支持WebGL引擎最好的DCC软件之一,结合pbr/gltf规范可以搭建完整的Web端三维模型工作流,为三维模型Web应用开发提供支撑。
零基础入门:从0到1学会 Apache Flink
大数据实时计算及 Apache Flink 年度Flink 年度学习资料大礼包,300+页实战应用精华总结!本书内容包含:1、零基础入门,30 天成长为 Flink 大神的经典教程。2、Apache Flink 核心贡献者及阿里巴巴技术专家的一线实战经验总结。3、收录来自 bilibili、美团点评、小米、OPPO、快手、Lyft、Netflix 等国内外一线大厂实时计算平台及实时数仓最佳实践案例
大数据&AI实战派 第2期
《大数据&AI实战派》系列电子书由阿里云开发者社区与阿里灵杰共同打造,覆盖数据计算、数据分析、数据湖/湖仓一体、机器学习等多个领域,解读各技术领域基础原理,剖析行业实践案例,培养大数据开发者从“生产-采集-存储-分析-开发-治理-价值体现”的技术能力。
阿里云实时计算Flink版解决方案白皮书-2021版
实时计算Flink版是阿里云基于 Apache Flink 构建的企业级、高性能实时大数据处理平台。为了帮助读者快速掌握实时计算Flink版,阿里云Apache Flink 创始团队特此推出本书。本书详细介绍了实时计算Flink版的产品结构、产品功能及优势。并以结合场景案例的方式在金融、电商、广告等九大行业的应用上给出相应的解决方案供读者学习,帮助读者在实践中学习使用阿里云实时计算 Flink 版。
Apache Flink 必知必会
“实时计算”不再只是未来趋势,它已经融入到企业生产的各个环节之中。一线开发同学如何掌握大数据极致算力应用,企业如何全面提升数据服务能力? 本书不仅有PMC 及 Committer 坐阵,全方位解析 Flink 底层架构、核心功能模块、社区生态等,知其然更知其所以然,还能带你手把手实操演示,轻松掌握 Flink 应用场景与功能实现的生产开发技能!零基础上手实战,7天轻松学会 Flink~
Paimon ✖️ StarRocks,共话实时湖仓架构
8月3日 Streaming Lakehouse Meetup · Online 邀请到了 Apache Paimon PMC ,阿里云,饿了么,喜马拉雅,同程旅行等众多业内大咖,为大家分享 Apache Paimon + StarRocks 在各场景中的最佳实践、生产经验和技术原理。
全链路数据治理-全域数据集成
DataWorks全链路数据治理包含智能数据建模、全域数据集成、高效数据开发、主动数据治理、全面数据安全、快速分析服务六大产品能力,覆盖数据的全生命周期。本篇全域数据集成向开发者介绍通过DataWorks数据集成在多表多表、多表到单表、单表到单表等场景下,进行实时或离线同步的技术选型与核心能力,并以MaxCompute与Hologres引擎为例,演示云上数据同步操作步骤最佳实践。
Elastic Stack 实战手册(早鸟版)
开源搜索引擎这十来年的发展,基本就是 Lucene 体系的发展。而基于 Lucene 的诸多搜索引擎中,Elasticsearch 以其极好的易用性、开箱即用的体验迅速折服了开发者。其边界也从最早的搜索引擎,扩展到了日志全观察、安全分析等场景,形成了今天的 Elastic Stack,具备从数据采集、处理、分析到展示的强大生态能力。
实时数仓Hologres技术实战一本通2.0版(下)
阿里云 10+资深技术专家深度解析,精心打磨内容,手把手教学。 融合实时大屏、实时报表、精细化运营、OLAP 迁移、数据服务等多个场景。8 个板块,20+内容,从零开始,入门到精通,快速助力搭建企业级一站式实时数仓。
阿里云MaxCompute百问百答
为了更好地帮助广大MaxCompute用户解决可能遇到的问题,阿里云 MaxCompute团队基于MaxCompute开发者社区和其它渠道反馈的问题,总结归纳 出MaxCompute各个功能点的常见问题,希望可以给正在学习和使用MaxCompute 的用户提供一些帮助。
大数据工程师必读手册
阿里巴巴如何玩转大数据?十位阿里巴巴大数据专家深度分析 ,飞天大数据平台八款产品最新玩法,2019不容错过的大数据手册——《大数据工程师必读手册》现在可以免费下载阅读啦,赶紧先睹为快吧。
Hologres 一站式实时数仓客户案例集
本案例集收录电商/教育/游戏等6个行业共计17家客户,通过Hologres分析服务一体化架构,替换各类OLAP分析引擎与KV数据库,实现海量半结构化/结构化数据的实时写入、实时更新、实时分析。
全链路数据治理-主动数据治理
2万字揭秘阿里巴巴数据治理平台建设实践。阿里巴巴一直将数据作为自己核心资产与能力之一,从最早的淘宝、天猫等电商业务,到后续优酷、高德、菜鸟等板块,面对各类数据治理需求的井喷,特别是降本等需求的不断出现,阿里云DataWorks团队将13年的产品建设经验整理成最佳实践,从7个方面为大家揭秘数据治理平台建设实践。
2022年开源大数据热力报告
《2022年开源大数据热力报告》,由开放原子开源基金会、X-lab开放实验室和阿里巴巴开源委员会联合出品。报告基于公开数据研究最活跃的102个开源大数据项目,探寻出开源大数据技术发展背后的“摩尔定律”。
Flink CDC:新一代数据集成框架
为了帮助读者能更全面地了解 Flink CDC,我们特地编撰了这本中文专刊。在这本专刊里你可以了解到:Flink CDC 的底层原理设计是什么样的?Flink CDC 如何保证数据读取的一致性?如何一步步快速上手 Flink CDC?以及 Flink CDC 在生产实践上的宝贵经验!
《实时数仓技术入门一本通》
云原生Hologres作为HSAP服务与分析一体化理念的最佳实践,到底有哪些核心技术优势?Hologres实时数仓原理是什么?又有哪些常见的写入场景?针对传统数据库痛点, Hologres 落地具体业务场景的最佳实践又是什么样的呢?这些问题都可以在本书找到答案!本书通过详细的图文介绍,指导读者搞定融合实时数仓&报表、数据仓库、传统OLAP迁移等10+个实战场景,助力实现服务和分析一体化实时数仓。
Streaming Lakehouse Meetup
Streaming Lakehouse Meetup · Online 。由阿里云开源大数据表存储团队负责人、阿里巴巴高级技术专家,Apache Flink PMC,Paimon PPMC 李劲松(花名:之信)作为出品人,联合业内大咖共同分享 Apache Paimon 在各场景中的最佳实践、生产经验、技术原理等。
MaxCompute半结构化数据思考与创新
《MaxCompute半结构化数据思考与创新》介绍了半结构化数据模型简析,与传统方案优劣对,MaxCompute思考与实践,以及收益分析。
PAI-ChatLearn 灵活易用大规模RLHF高训练框架
《PAI-ChatLearn 灵活易用大规模RLHF高训练框架》介绍了PAI-ChatLearn框架,且通过实际案例演示了PAI-ChatLearn的功能。
PAI-Megatron-Patch:灵骏集群训练 LLMs
本书深入探讨了如何利用PAI平台提供的高性能计算资源和优化工具来训练大型语言模型,特别是在分布式集群环境下的高效训练方法。
阿里云云原生一体化数仓新能力解读
云原生一体化数仓是阿里云推出的一站式大数据处理平台,具备流批一体、实时离线一体、湖仓一体、 全链路数据治理四大核心能力。本书将分为离线实时一体、分析服务一体、湖仓一体、数据安全、数据建模、数据治理,六大热门主题,六位大数据专家,带你了解炙手可热的云数据产品最新演进趋势,为大数据开发者讲述一体化数仓的核心产品能力以及在业务中的应用。
大数据&AI实战派 第1期
《大数据&AI实战派》系列电子书由阿里云开发者社区与阿里灵杰共同打造,覆盖数据计算、数据分析、数据湖/湖仓一体、机器学习等多个领域,解读各技术领域基础原理,剖析行业实践案例。电子书第1期以《阿里云大数据知识图谱》为核心,通过阿里云大数据&AI产品能力介绍结合操作实践,培养大数据开发者从“生产-采集-存储-分析-开发-治理-价值体现”的技术能力。
Elastic(中国)产品应用实战
《Elastic 开发者手册》的创作发布,源于阿里云开发者社区和 Elastic 中国的友好合作。手册共分为上下两册,本篇为下册。书的内容均来源于Elastic中国官方微信公众号,集合了8篇优质内容。本书为读者详解了Elastic的功能实战和开发效能,呈现了行业中应用Elastic产品能力的实践案例,例如追踪最近的客户订单、获取数据视图等等,供开发者学习并加以实践。
大数据与机器学习
大数据领域前沿技术分享与交流,这里不止有技术干货、学习心得、企业实践、社区活动,还有未来。