开源大数据平台 E-MapReduce-电子书-阿里云开发者社区-阿里云

StarRocks-新一代极速全场景MPP数据仓库产品解决方案。StarRocks 具备⽔平在线扩缩容，⾦融级⾼可⽤，兼容 MySQL 5.7 协议和 MySQL ⽣态，提供全⾯向量化引擎与多种数据源联邦查询等重要特性。StarRocks 致力于在全场景 OLAP 业务上为⽤户提供统⼀的解决⽅案，适⽤于对性能、实时性、并发能⼒和灵活性有较⾼要求的各类应⽤场景。

3335 31

扬流

技术作品

2022年开源大数据热力报告

《2022年开源大数据热力报告》，由开放原子开源基金会、X-lab开放实验室和阿里巴巴开源委员会联合出品。报告基于公开数据研究最活跃的102个开源大数据项目，探寻出开源大数据技术发展背后的“摩尔定律”。

3811 30

扬流

数据采集数据管理云计算

技术作品

中国云原生数据湖应用洞察白皮书

近年来，在数字经济的背景下，互联网行业及传统企业加速云化转型，中国整体云服务市场的规模逐年扩增，云成为新一代IT基础设施已经成为不争的事实。其中，企业云化转型的深入以及用云思维的转变，驱动了PaaS市场份额的增长，基于云的能力创新已成为基础云发展新的增长引擎。云特有的“池化、弹性、成本、敏捷”等优势让数据层与应用层的很多设想得以实现，拥抱云原生成为数据湖乃至大数据的必然选择。

1906 27

扬流

数据管理 OLAP

技术作品

数据湖技术解析

数据湖无疑是近几年大数据领域最火热的一个方向，那到底什么是数据湖？数据湖的架构和核心技术有哪些？企业应该如何构建、管理和使用数据湖？阿里云开源大数据团队结合在数据湖领域多年的深耕和实战经验，通过本书全方位介绍了从数据湖架构到核心技术到平台构建的内容。

43896 54

灵杰开发者

数据挖掘

技术作品

Databricks数据洞察：从入门到实践

Delta Lake 作为数据湖核心存储引擎方案能给企业带来诸多的优势。本书从技术基础介绍到场景应用实践，从大数据平台架构的演进、Delta Lake关键特性、实现原理，以及数据仓库、数据湖的优劣势，湖仓一体架构的应用等多方面解析Lakehouse架构和Delta Lake的应用优势。帮助读者入门数据湖Lakehouse以及部分spark相关应用。

30530 38

MaxCompute

5月前

技术作品

阿里云E-MapReduce 全面开启 Serverless

130 3

扬流

技术作品

阿里云EMR2.0 平台：让大数据更简单

254 52

开发者说

技术作品

Apache Spark 中文实战攻略上册

《Apache Spark 中文实战攻略》上下两册电子书重磅来袭，本书集结国内外顶级大厂技术专家，汇集多年实战经验，带你走进全球顶级开源社区之一 Apache Spark，探秘时下最流行的开源分布式内存式大数据处理引擎。《Apache Spark 中文实战攻略（上册）》全新收录了Spark+AI Summit 2020 中文精华版峰会，Apache Spark 3.0性能优化与基础实战一书看遍！

35805 94

扬流

技术作品

阿里云EMR 2.0：重新定义新一代开源大数据平台

193 1

扬流

技术作品

数据湖统一元数据与权限

432 3

开发者说

技术作品

Apache Spark 中文实战攻略下册

Apache Spark 中文实战攻略》上下两册电子书重磅来袭，本书集结国内外顶级大厂技术专家，汇集多年实战经验，带你走进全球顶级开源社区之一 Apache Spark，探秘时下最流行的开源分布式内存式大数据处理引擎。《Apache Spark 中文实战攻略（下册）》让企业大数据平台性能更优。阿里、Databricks、领英、Intel都在用！Spark 企业级最佳实践中文解读全收纳！

24892 87