开源大数据平台 E-MapReduce-电子书-阿里云开发者社区-阿里云

Delta Lake 作为数据湖核心存储引擎方案能给企业带来诸多的优势。本书从技术基础介绍到场景应用实践，从大数据平台架构的演进、Delta Lake关键特性、实现原理，以及数据仓库、数据湖的优劣势，湖仓一体架构的应用等多方面解析Lakehouse架构和Delta Lake的应用优势。帮助读者入门数据湖Lakehouse以及部分spark相关应用。

31186 141

扬流

OLAP 数据管理数据处理

技术作品

EMR StarRocks 白皮书

StarRocks-新一代极速全场景MPP数据仓库产品解决方案。StarRocks 具备⽔平在线扩缩容，⾦融级⾼可⽤，兼容 MySQL 5.7 协议和 MySQL ⽣态，提供全⾯向量化引擎与多种数据源联邦查询等重要特性。StarRocks 致力于在全场景 OLAP 业务上为⽤户提供统⼀的解决⽅案，适⽤于对性能、实时性、并发能⼒和灵活性有较⾼要求的各类应⽤场景。

3912 114

扬流

技术作品

数据湖统一元数据与权限

656 58

扬流

数据采集数据管理云计算

技术作品

中国云原生数据湖应用洞察白皮书

近年来，在数字经济的背景下，互联网行业及传统企业加速云化转型，中国整体云服务市场的规模逐年扩增，云成为新一代IT基础设施已经成为不争的事实。其中，企业云化转型的深入以及用云思维的转变，驱动了PaaS市场份额的增长，基于云的能力创新已成为基础云发展新的增长引擎。云特有的“池化、弹性、成本、敏捷”等优势让数据层与应用层的很多设想得以实现，拥抱云原生成为数据湖乃至大数据的必然选择。

2141 102

开发者说

技术作品

Apache Spark 中文实战攻略上册

《Apache Spark 中文实战攻略》上下两册电子书重磅来袭，本书集结国内外顶级大厂技术专家，汇集多年实战经验，带你走进全球顶级开源社区之一 Apache Spark，探秘时下最流行的开源分布式内存式大数据处理引擎。《Apache Spark 中文实战攻略（上册）》全新收录了Spark+AI Summit 2020 中文精华版峰会，Apache Spark 3.0性能优化与基础实战一书看遍！

36171 186

扬流

技术作品

阿里云EMR2.0 平台：让大数据更简单

413 97

扬流

技术作品

阿里云EMR 2.0：重新定义新一代开源大数据平台

391 76

开发者说

技术作品

Apache Spark 中文实战攻略下册

Apache Spark 中文实战攻略》上下两册电子书重磅来袭，本书集结国内外顶级大厂技术专家，汇集多年实战经验，带你走进全球顶级开源社区之一 Apache Spark，探秘时下最流行的开源分布式内存式大数据处理引擎。《Apache Spark 中文实战攻略（下册）》让企业大数据平台性能更优。阿里、Databricks、领英、Intel都在用！Spark 企业级最佳实践中文解读全收纳！

25165 164