开源大数据平台 E-MapReduce-最新-第16页-阿里云开发者社区-阿里云

阿里云E-MapReduce团队

|

存储 SQL XML

|

博文

阿里云 E-MapReduce ClickHouse 操作指南 03 期 — ClickHouse 运维

阿里云 E-MapReduce（简称 EMR ）是运行在阿里云平台上的一种大数据处理的系统解决方案。ClickHouse 作为开源的列式存储数据库，主要用于在线分析处理查询（OLAP），能够使用 SQL 查询实时生成分析数据报告。而阿里云 EMR ClickHouse 则提供了开源 OLAP 分析引擎 ClickHouse 的云上托管服务。

1030 0 0

阿里云E-MapReduce团队

|

存储分布式计算网络协议

|

博文

阿里云 E-MapReduce ClickHouse 操作指南 02期 — 快速入门

阿里云 E-MapReduce（简称EMR）是运行在阿里云平台上的一种大数据处理的系统解决方案。ClickHouse 作为开源的列式存储数据库，主要用于在线分析处理查询（OLAP），能够使用 SQL 查询实时生成分析数据报告。而阿里云 EMR ClickHouse 则提供了开源 OLAP 分析引擎 ClickHouse 的云上托管服务。

837 0 0

阿里云E-MapReduce团队

|

存储 SQL 运维

|

博文

阿里云 E-MapReduce ClickHouse 操作指南 01期 — ClickHouse 概述

阿里云 E-MapReduce（简称EMR）是运行在阿里云平台上的一种大数据处理的系统解决方案。ClickHouse 作为开源的列式存储数据库，主要用于在线分析处理查询（OLAP），能够使用 SQL 查询实时生成分析数据报告。而阿里云 EMR ClickHouse 则提供了开源 OLAP 分析引擎 ClickHouse 的云上托管服务。

722 0 0

阿里云E-MapReduce团队

|

大数据

|

博文

2021大数据开发平台用户调研问卷，填写问卷有机会领取EMR定制礼品！

为了给您提供更加优质的大数据开发平台服务，同时帮助我们更好地优化和提升大数据开发平台，现进行阿里云 EMR 大数据开发平台有奖调研。参与调研，就有机会领取阿里云 EMR 定制礼品，EMR 定制背包、太阳伞、定制T恤~~我们期待您最真实的反馈！感谢您对阿里云 EMR 产品的大力支持！！

449 0 0

社区课程

|

课程

EMR on ACK 全新发布，助力企业高效构建大数据平台

阿里云 EMR on ACK 为用户提供了全新的构建大数据平台的方式，用户可以将开源大数据服务部署在阿里云容器服务（ACK）上。利用 ACK 在服务部署和对高性能可伸缩的容器应用管理的能力优势，用户只需要专注在大数据作业本身。用户可以便捷地将 Spark、Presto、Flink 作业执行在 ACK 集群上，100%兼容开源，性能优于开源。

745 0 0

阿里云E-MapReduce团队

|

存储 JSON 分布式计算

|

博文

如何快速搭建云原生企业级数据湖架构及实践分享

众所周知，数据湖技术在大数据领域炙手可热，随着在云上的广泛部署和应用，其业务价值逐渐获得业界共识。如何快搭建数据湖架构被越来越多的企业探讨。本文主要分享快速搭建云原生企业级数据湖架构及实践分享。

864 0 0

Dev-Talk

|

视频

如何快速搭建云原生企业级数据湖架构及实践分享

众所周知，数据湖技术在大数据领域炙手可热，随着在云上的广泛部署和应用，其业务价值逐渐获得业界共识。如何快搭建数据湖架构被越来越多的企业探讨。本次演讲主要分享快速搭建云原生企业级数据湖架构及实践分享。讲师简介王震 -- 阿里云计算平台事业部开源大数据平台技术专家

1206 0 0

阿里云E-MapReduce团队

|

SQL 存储机器学习/深度学习

|

博文

基于英特尔® 优化分析包（OAP）的 Spark 性能优化方案

Spark SQL 作为 Spark 用来处理结构化数据的一个基本模块，已经成为多数企业构建大数据应用的重要选择。但是，在大规模连接（Join）、聚合（Aggregate）等工作负载下，Spark 性能会面临稳定性和性能方面的挑战。

1286 0 1

阿里云E-MapReduce团队

|

机器学习/深度学习分布式计算 Cloud Native

|

博文

26万奖金 | 第一届 E-MapReduce 极客挑战赛诚邀英才前来挑战！

日前，“ 第一届 E-MapReduce 极客挑战赛 ”在阿里云天池官网正式开赛。据悉，本次大赛由阿里云、英特尔联合举办，聚焦 SparkSQL 执行效率，探索 TPC-DS 测试集最优性能，助力海量数据轻松上云，全程将有资深技术专家提供技术指导。

654 0 0

Dev-Talk

|

视频

E-MapReduce 极客挑战赛线上宣讲会

直播介绍：（建议600字以内）E-MapReduce 极客挑战赛线上宣讲会直播内容：1、大咖寄语2、赛事解读讲师简介EMR极客挑战赛官方

623 0 0

阿里云E-MapReduce团队

|

SQL 弹性计算人工智能

|

博文

【月刊】E-MapReduce 2021-06/07 产品月刊

6-7月 E-MapReduce 上线EMR-3.36.x版本、EMR-5.2.x版本，同步对SmartData 3.6.x版本进行更新；最佳实践案例发表《云原生数据湖构建、分析与开发治理最佳实践及案例分享》、《StarLake：汇量科技云原生数据湖的探索和实践》、《DLF +DDI 一站式数据湖构建与分析最佳实践》；首届 E-MapReduce 极客挑战赛正式启动。欢迎持续关注更多精彩内容！

598 0 0

阿里云E-MapReduce团队

|

存储分布式计算资源调度

|

博文

赛题解析 | E-MapReduce 极客挑战赛

首届 E-MapReduce 极客挑战赛已开启，奖金高达26万，欢迎大家踊跃报名！本文主要讲解自测工具的使用以及代码的提交和评测，帮助选手更高效的解题。

930 0 0

阿里云E-MapReduce团队

|

SQL 分布式计算搜索推荐

|

博文

《 Delta Lake 数据湖专题系列5讲》文章回顾

《Delta Lake 数据湖专题系列5讲》由阿里云 DDI 团队翻译整理自大数据技术公司 Databricks 针对数据湖 Delta Lake 系列技术文章。阅读完此系列文章可以帮助您达到入门级，对数据湖 Lakehouse 有整体上的认识和应用，掌握理论知识体系。

1239 0 0

阿里云E-MapReduce团队

|

安全

|

博文

E-MapReduce 数据湖 Meetup 8.7上海站延期

由于疫情防控的原因，原定 8 月 7 日的 E-MapReduce 数据湖 Meetup 延期。

345 0 0

阿里云E-MapReduce团队

|

存储消息中间件分布式计算

|

博文

DLF +DDI 一站式数据湖构建与分析最佳实践

本文由阿里云数据湖构建 DLF 团队和 Databricks 数据洞察团队联合撰写，旨在帮助您更深入地了解阿里云数据湖构建（DLF）+Databricks 数据洞察（DDI）构建一站式云上数据入湖。

2081 0 0

阿里云E-MapReduce团队

|

SQL 存储分布式计算

|

博文

数据湖实操讲解【 JindoTable 计算加速】第二十二讲：对 Hive 数仓表进行高效小文件合并

数据湖 JindoFS+OSS 实操干货 36讲每周二16点准时直播！扫文章底部二维码入钉群，线上准时观看~ Github链接： https://github.com/aliyun/alibabacloud-jindofs

1186 0 0

阿里云E-MapReduce团队

|

SQL 存储缓存

|

博文

数据湖实操讲解【 JindoTable 计算加速】第二十一讲：分层更高效，对 Hive 数仓进行热度/冷度统计

数据湖 JindoFS+OSS 实操干货 36讲每周二16点准时直播！扫文章底部二维码入钉群，线上准时观看~ Github链接： https://github.com/aliyun/alibabacloud-jindofs

474 0 0

阿里云E-MapReduce团队

|

存储 SQL Cloud Native

|

博文

高能预警！ E-MapReduce 数据湖 Meetup · 上海站重磅来袭

8月7日，阿里云 E-MapReduce 数据湖首场 Meetup 重磅上线。来自 Intel、Cloudera、阿里巴巴的七位技术专家齐聚上海，为你带来超多数据湖干货和行业新动态~

539 0 0

阿里云E-MapReduce团队

|

分布式计算 Cloud Native 大数据

|

博文

首届！E-MapReduce 极客挑战赛强势来袭，重磅奖项等你拿，快来组队报名啦

首届 E-MapReduce 极客挑战赛发布，聚焦.SparkSQL执行效率。结合阿里云 EMR和英特尔® 傲腾™ 数据中心级持久内存（以及Intel OAP软件包)，优化软件系统和利用硬件的特征，追求TPC-DS测试集的最优性能。帮助参赛队伍实现Spark 代码优化和参数调优，完成性能的优化挑战。

501 0 0

阿里云E-MapReduce团队

|

机器学习/深度学习存储人工智能

|

博文

Flink on Zeppelin 流计算处理最佳实践

欢迎钉钉扫描文章底部二维码进入 EMR Studio 用户交流群直接和讲师交流讨论~ 点击以下链接直接观看直播回放：https://developer.aliyun.com/live/247106

857 0 0

Dev-Talk

|

视频

开源大数据社区 & 阿里云 E-MapReduce 系列直播第12期

此次课程是继上一节“ Spark 大数据处理最佳实践 ” 课后，大数据最佳实践课程的第二课。主要讲一下 flink 流计算的最佳实践。讲师根据自己多年经验总结的方法论，从 flink 学习框架入手，配合一些非常落地的最佳实践，带你有章法的学习 flink ，摆脱技术小白称号！讲师简介简锋阿里云 EMR 数据开发平台负责人

899 0 0

阿里云E-MapReduce团队

|

SQL 存储缓存

|

博文

数据湖实操讲解【 JindoTable 计算加速】第二十讲：Spark 对 OSS 上的 ORC 数据进行查询加速

数据湖 JindoFS+OSS 实操干货 36讲每周二16点准时直播！扫文章底部二维码入钉群，线上准时观看~ Github链接： https://github.com/aliyun/alibabacloud-jindofs

687 0 0

阿里云E-MapReduce团队

|

存储 SQL 分布式计算

|

博文

数据湖实操讲解【 JindoTable 计算加速】第十九讲：Spark 对 OSS 上的 Parquet 数据进行查询加速

数据湖 JindoFS+OSS 实操干货 36讲每周二16点准时直播！扫文章底部二维码入钉群，线上准时观看~ Github链接： https://github.com/aliyun/alibabacloud-jindofs

647 0 0

阿里云E-MapReduce团队

|

SQL 机器学习/深度学习存储

|

博文

Spark 大数据处理最佳实践

欢迎钉钉扫描文章底部二维码进入 EMR Studio 用户交流群直接和讲师讨论交流~ 点击该链接直接观看直播回放：https://developer.aliyun.com/live/247072

3346 0 0

阿里云E-MapReduce团队

|

机器学习/深度学习存储缓存

|

博文

数据湖实操讲解【 AI 训练加速】第十八讲：Fluid + JindoFS 对海量小文件的训练加速

数据湖 JindoFS+OSS 实操干货 36讲每周二16点准时直播！扫文章底部二维码入钉群，线上准时观看~ Github链接： https://github.com/aliyun/alibabacloud-jindofs

784 0 0

Dev-Talk

|

视频

开源大数据社区 & 阿里云 E-MapReduce 系列直播第11期

Spark 大家应该都很熟了，我们这次的 Spark 最佳实践课程不会生搬硬套去讲一些你能在网上找得到的东西。而是讲师基于自己多年的经验总结出来的一些关于Spark或者是大数据方面一些原则性的东西，一些非常落地的最佳实践，主要的目标是让你为摆脱Spark小白用户的称号。讲师简介简锋阿里云 EMR 数据开发平台负责人

911 0 0

阿里云E-MapReduce团队

|

存储机器学习/深度学习人工智能

|

博文

数据湖实操讲解【 AI 训练加速】第十七讲：Fluid + JindoFS 对 HDFS 上的数据进行训练加速

数据湖 JindoFS+OSS 实操干货 36讲每周二16点准时直播！扫文章底部二维码入钉群，线上准时观看~ Github链接： https://github.com/aliyun/alibabacloud-jindofs

845 0 0

Dev-Talk

|

视频

开源大数据社区 & 阿里云 E-MapReduce 系列直播第10期

EMR on ACK是企业级半托管的开源大数据平台，为阿里云E-MapReduce(EMR)提供了一个部署选项，允许您在阿里云容器服务Kubernetes版 (ACK) 上运行开源大数据框架。Yarn on K8S方案帮助您平衡不同集群的资源使用，共享集群间计算资源，充分利用所有节点的计算资源，满足计算资源弹性调度，云上混合部署在线和离线任务的需求。本次直播将重点展开 Yarn on ACK 的弹性介绍。讲师简介霁谦阿里云开源大数据平台高级开发工程师

1394 56 57

阿里云E-MapReduce团队

|

机器学习/深度学习存储分布式计算

|

博文

【详谈 Delta Lake 】系列技术专题之客户用例（ Customer Use Case)

本文翻译自大数据技术公司 Databricks 针对数据湖 Delta Lake 的系列技术文章。众所周知，Databricks 主导着开源大数据社区 Apache Spark、Delta Lake 以及 ML Flow 等众多热门技术，而 Delta Lake 作为数据湖核心存储引擎方案给企业带来诸多的优势。本系列技术文章，将详细展开介绍 Delta Lake。

721 0 0

阿里云E-MapReduce团队

|

存储缓存人工智能

|

博文

数据湖实操讲解【AI 训练加速】第十六讲：Fluid + JindoFS 对 OSS 上数据进行训练加速

数据湖 JindoFS+OSS 实操干货 36讲每周二16点准时直播！扫文章底部二维码入钉群，线上准时观看~ Github链接： https://github.com/aliyun/alibabacloud-jindofs

1175 0 0

阿里云E-MapReduce团队

|

存储机器学习/深度学习 JSON

|

博文

【详谈 Delta Lake 】系列技术专题之 Streaming（流式计算）

本文翻译自大数据技术公司 Databricks 针对数据湖 Delta Lake 的系列技术文章。众所周知，Databricks 主导着开源大数据社区 Apache Spark、Delta Lake 以及 ML Flow 等众多热门技术，而 Delta Lake 作为数据湖核心存储引擎方案给企业带来诸多的优势。本系列技术文章，将详细展开介绍 Delta Lake。

1597 0 1

阿里云E-MapReduce团队

|

SQL 缓存分布式计算

|

博文

数据湖实操讲解【JindoFS 缓存加速】第十五讲：云上计算云下数据：HDFS 缓存加速

数据湖 JindoFS+OSS 实操干货 36讲每周二16点准时直播！扫文章底部二维码入钉群，线上准时观看~ Github链接： https://github.com/aliyun/alibabacloud-jindofs

5436 0 0

Dev-Talk

|

视频

开源大数据社区 & 阿里云 E-MapReduce 系列直播第9期

EMR on ACK是企业级半托管的开源大数据平台，为阿里云E-MapReduce(EMR)提供了一个部署选项，允许您在阿里云容器服务Kubernetes版 (ACK) 上运行开源大数据框架。目前支持Spark引擎的部署，结合自研的Remote shuffle service（RSS）服务组件，提供用户高稳定、高性价比、灵活的弹性计算服务。RSS解决了计算存储分离和混合架构下的shuffle稳定性和性能问题。本次直播将重点展开RSS的使用和性能展示。讲师介绍吴雪扬（枢木），阿里云高级开发工程师

2238 0 0

阿里云E-MapReduce团队

|

存储缓存分布式计算

|

博文

数据湖实操讲解【JindoFS 缓存加速】第十四讲：指定表和分区来预先缓存，查询分析更高效

数据湖 JindoFS+OSS 实操干货 36讲每周二16点准时直播！扫文章底部二维码入钉群，线上准时观看~ Github链接： https://github.com/aliyun/alibabacloud-jindofs

5227 0 0

阿里云E-MapReduce团队

|

存储机器学习/深度学习 SQL

|

博文

【详谈 Delta Lake 】系列技术专题之湖仓一体（ Lakehouse ）

本文翻译自大数据技术公司 Databricks 针对数据湖 Delta Lake 的系列技术文章。众所周知，Databricks 主导着开源大数据社区 Apache Spark、Delta Lake 以及 ML Flow 等众多热门技术，而 Delta Lake 作为数据湖核心存储引擎方案给企业带来诸多的优势。本系列技术文章，将详细展开介绍 Delta Lake。

2342 0 0

阿里云E-MapReduce团队

|

SQL 存储分布式计算

|

博文

【详谈 Delta Lake 】系列技术专题之特性（Features）

本文翻译自大数据技术公司 Databricks 针对数据湖 Delta Lake 的系列技术文章。众所周知，Databricks 主导着开源大数据社区 Apache Spark、Delta Lake 以及 ML Flow 等众多热门技术，而 Delta Lake 作为数据湖核心存储引擎方案给企业带来诸多的优势。本系列技术文章，将详细展开介绍 Delta Lake。

1857 0 0

Dev-Talk

|

视频

开源大数据社区 & 阿里云 E-MapReduce 系列直播第7期

云原生数据湖构建与分析最佳实践讲师花名健身--阿里巴巴计算平台事业部 EMR技术专家

749 0 0

阿里云E-MapReduce团队

|

SQL 存储缓存

|

博文

数据湖实操讲解【JindoFS 缓存加速】第十三讲：Presto 访问 OSS 透明缓存加速

数据湖 JindoFS+OSS 实操干货 36讲每周二16点准时直播！扫文章底部二维码入钉群，线上准时观看~ Github链接： https://github.com/aliyun/alibabacloud-jindofs

11387 0 1

阿里云E-MapReduce团队

|

存储 SQL 缓存

|

博文

数据湖实操讲解【JindoFS 缓存加速】第十二讲：Spark 访问 OSS 透明缓存加速

数据湖 JindoFS+OSS 实操干货 36讲每周二16点准时直播！扫文章底部二维码入钉群，线上准时观看~ Github链接： https://github.com/aliyun/alibabacloud-jindofs

1941 0 0

阿里云E-MapReduce团队

|

存储 SQL 分布式计算

|

博文

数据湖实操讲解【OSS 访问加速】第十一讲：打开 OSS 多版本-合规和分析两不误

数据湖 JindoFS+OSS 实操干货 36讲每周二16点准时直播！扫文章底部二维码入钉群，线上准时观看~ Github链接： https://github.com/aliyun/alibabacloud-jindofs

2030 0 0

阿里云E-MapReduce团队

|

SQL 存储数据采集

|

博文

【详谈 Delta Lake 】系列技术专题之基础和性能（Fundamentals and Performance）

本文翻译自大数据技术公司 Databricks 针对数据湖 Delta Lake 的系列技术文章。众所周知，Databricks 主导着开源大数据社区 Apache Spark、Delta Lake 以及 ML Flow 等众多热门技术，而 Delta Lake 作为数据湖核心存储引擎方案给企业带来诸多的优势。本系列技术文章，将详细展开介绍 Delta Lake。

3058 0 0

阿里云E-MapReduce团队

|

存储 SQL 分布式计算

|

博文

数据湖实操讲解【OSS 访问加速】第十讲：Impala 如何高效查询 OSS 数据

数据湖 JindoFS+OSS 实操干货 36讲每周二16点准时直播！扫文章底部二维码入钉群，线上准时观看~ Github链接： https://github.com/aliyun/alibabacloud-jindofs

3439 0 0

阿里云E-MapReduce团队

|

SQL 存储 Java

|

博文

数据湖实操讲解【OSS 访问加速】第九讲：Presto 如何高效查询 OSS 数据

数据湖 JindoFS+OSS 实操干货 36讲每周二16点准时直播！扫文章底部二维码入钉群，线上准时观看~ Github链接： https://github.com/aliyun/alibabacloud-jindofs

2588 0 0

casterQ

|

问答

宽窄依赖 & Job生成问题

2545 0 0

阿里云E-MapReduce团队

|

SQL 分布式计算 DataWorks

|

博文

【月刊】E-MapReduce 2021-04/05 产品月刊

4-5月 E-MapReduce 上线EMR-3.35.x版本、EMR-4.9.x版本，同步对SmartData 3.5.x版本进行更新；客户实践案例发表《Databricks 数据洞察 Delta Lake 在基智科技（STEPONE）的应用实践》与《Databricks数据洞察在美的暖通与楼宇的应用实践》；【数据湖 JindoFS+OSS 实操干货36讲】公开课重磅上线。欢迎持续关注更多精彩内容！

1581 0 0

阿里云E-MapReduce团队

|

存储 SQL 人工智能

|

博文

StarLake：汇量科技云原生数据湖的探索和实践

快速了解汇量科技在云原生数据湖领域的探索和实践，详解 StarLake 的架构及业务应用案例。

1706 0 0

1785809089825478

|

分布式计算 Spark

|

问答

请问有木有spark中国社区交流钉钉群，求加入

2317 0 0

阿里云E-MapReduce团队

|

存储缓存分布式计算

|

博文

阿里大数据云原生化实践，EMR Spark on ACK 产品介绍

欢迎钉钉扫描文章底部二维码进入 EMR钉钉交流群直接和讲师讨论交流~ 点击该链接直接观看直播回放：https://developer.aliyun.com/live/246868

3090 0 0

阿里云E-MapReduce团队

|

存储弹性计算分布式计算

|

博文

云原生数据湖构建、分析与开发治理最佳实践及案例分享

什么是数据湖？又如何对对数据湖进行分析与开发治理？本文深入浅出的介绍了云原生数据湖构建、分析与开发治理最佳实践及案例分享。

9925 0 0

开源大数据平台 E-MapReduce

最新

博文

E-MapReduce

视频

免费试用

全部内容

问答

电子书

活动

学习

阿里云 E-MapReduce ClickHouse 操作指南 03 期 — ClickHouse 运维

阿里云 E-MapReduce ClickHouse 操作指南 02期 — 快速入门

阿里云 E-MapReduce ClickHouse 操作指南 01期 — ClickHouse 概述

2021大数据开发平台用户调研问卷，填写问卷有机会领取EMR定制礼品！

EMR Studio 大数据处理最佳实践课程

EMR on ACK 全新发布，助力企业高效构建大数据平台

如何快速搭建云原生企业级数据湖架构及实践分享

如何快速搭建云原生企业级数据湖架构及实践分享

基于英特尔® 优化分析包（OAP）的 Spark 性能优化方案

26万奖金 | 第一届 E-MapReduce 极客挑战赛 诚邀英才前来挑战！

E-MapReduce 极客挑战赛线上宣讲会

【月刊】E-MapReduce 2021-06/07 产品月刊

赛题解析 | E-MapReduce 极客挑战赛

《 Delta Lake 数据湖专题系列5讲》文章回顾

E-MapReduce 数据湖 Meetup 8.7上海站延期

DLF +DDI 一站式数据湖构建与分析最佳实践

数据湖实操讲解【 JindoTable 计算加速】第二十二讲：对 Hive 数仓表进行高效小文件合并

数据湖实操讲解【 JindoTable 计算加速】第二十一讲：分层更高效，对 Hive 数仓进行热度/冷度统计

高能预警！ E-MapReduce 数据湖 Meetup · 上海站重磅来袭

首届！E-MapReduce 极客挑战赛强势来袭，重磅奖项等你拿，快来组队报名啦

Flink on Zeppelin 流计算处理最佳实践

开源大数据社区 & 阿里云 E-MapReduce 系列直播 第12期

数据湖实操讲解【 JindoTable 计算加速】第二十讲：Spark 对 OSS 上的 ORC 数据进行查询加速

数据湖实操讲解【 JindoTable 计算加速】第十九讲：Spark 对 OSS 上的 Parquet 数据进行查询加速

Spark 大数据处理最佳实践

数据湖实操讲解【 AI 训练加速】第十八讲：Fluid + JindoFS 对海量小文件的训练加速

开源大数据社区 & 阿里云 E-MapReduce 系列直播 第11期

数据湖实操讲解【 AI 训练加速】第十七讲：Fluid + JindoFS 对 HDFS 上的数据进行训练加速

开源大数据社区 & 阿里云 E-MapReduce 系列直播 第10期

【详谈 Delta Lake 】系列技术专题 之 客户用例（ Customer Use Case)

数据湖实操讲解【AI 训练加速】第十六讲：Fluid + JindoFS 对 OSS 上数据进行训练加速

【详谈 Delta Lake 】系列技术专题 之 Streaming（流式计算）

数据湖实操讲解【JindoFS 缓存加速】第十五讲：云上计算云下数据：HDFS 缓存加速

开源大数据社区 & 阿里云 E-MapReduce 系列直播 第9期

数据湖实操讲解【JindoFS 缓存加速】第十四讲：指定表和分区来预先缓存，查询分析更高效

【详谈 Delta Lake 】系列技术专题 之 湖仓一体（ Lakehouse ）

【详谈 Delta Lake 】系列技术专题 之 特性（Features）

开源大数据社区 & 阿里云 E-MapReduce 系列直播 第7期

数据湖实操讲解【JindoFS 缓存加速】第十三讲：Presto 访问 OSS 透明缓存加速

数据湖实操讲解【JindoFS 缓存加速】第十二讲：Spark 访问 OSS 透明缓存加速

数据湖实操讲解【OSS 访问加速】第十一讲：打开 OSS 多版本-合规和分析两不误

【详谈 Delta Lake 】系列技术专题 之 基础和性能（Fundamentals and Performance）

数据湖实操讲解【OSS 访问加速】第十讲：Impala 如何高效查询 OSS 数据

数据湖实操讲解【OSS 访问加速】第九讲：Presto 如何高效查询 OSS 数据

宽窄依赖 & Job生成问题

【月刊】E-MapReduce 2021-04/05 产品月刊

StarLake：汇量科技云原生数据湖的探索和实践

请问有木有spark中国社区交流钉钉群，求加入

阿里大数据云原生化实践，EMR Spark on ACK 产品介绍

云原生数据湖构建、分析与开发治理最佳实践及案例分享

活跃用户

相关产品

26万奖金 | 第一届 E-MapReduce 极客挑战赛诚邀英才前来挑战！

开源大数据社区 & 阿里云 E-MapReduce 系列直播第12期

开源大数据社区 & 阿里云 E-MapReduce 系列直播第11期

开源大数据社区 & 阿里云 E-MapReduce 系列直播第10期

【详谈 Delta Lake 】系列技术专题之客户用例（ Customer Use Case)

【详谈 Delta Lake 】系列技术专题之 Streaming（流式计算）

开源大数据社区 & 阿里云 E-MapReduce 系列直播第9期

【详谈 Delta Lake 】系列技术专题之湖仓一体（ Lakehouse ）

【详谈 Delta Lake 】系列技术专题之特性（Features）

开源大数据社区 & 阿里云 E-MapReduce 系列直播第7期

【详谈 Delta Lake 】系列技术专题之基础和性能（Fundamentals and Performance）