【Spark Summit East 2017】Spark与在线分析

简介: 本讲义出自Shubham Chopra在Spark Summit East 2017上的演讲,主要介绍了Spark设计初衷是作为批处理分析系统,通过缓存RDD对于迭代处理相同数据的任务进行了加速,这种模式也适用于在线分析,本次演讲试图定义失效能够导致大规模命中在线查询性能和可能的解决方案的特殊区域。

更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps


本讲义出自Shubham Chopra在Spark Summit East 2017上的演讲,主要介绍了Spark设计初衷是作为批处理分析系统,通过缓存RDD对于迭代处理相同数据的任务进行了加速,这种模式也适用于在线分析,本次演讲中,Shubham Chopra试图定义失效能够导致大规模命中在线查询性能和可能的解决方案的特殊区域。


6ccb9156dd71a059464e2138dfa77a29be99546e

d3a6afb048182aa458984dcaa6a9da2897e00103

bfa2d17f163fa5f62edb611f74c577f4ae68b9b3

1d186b442bb61ae8102e13f2692076b344282464

610425f2938cfaa70a1c0b4ba396926c382c97cd

5437b0d6a1151c8c773c7fa6c7e8dc5faeb82f78

ad6523b2ca4cbeb4c8c95dc51b6c3792906aec7a

38a8b6ae19b10358cb516d79c1dfe38d65f958a0

82a625de14a61aa0b8ae00747ac66e3e6462f903

d3f583dd99732388326e11a3f9cced284e505059

1e676d736a8b3dc0314b9c4c627b08cf60b602eb

f1036a4da4b3ea807586f0e3bb36e3643ac78f80

0d9d8034b089900e952577316036496c7cafbdd2

79ff144504585b052ed0c83952099a28530c6f06

b63b9d3c37bc6c0dd61ff3c8c1623cf42cdacef9

31e666f3c9b17772095e97845326485afbb486d4

4957470e0f72410427bd9ec9b4d80dccc0a88a37

653ab92f25f0eab20c40dce75e50c995acda70cf

e049e1f5d3c669484e1f8c838696a1370c158f2d

6fa7f11a7c0646b66cd0e578e973ec3fc2f4565f

c92b3235fb4b879831276a142e60acb6d3f989f2

59511381978547abea47a141ab0d1333b9b6147b

相关文章
|
5月前
|
机器学习/深度学习 分布式计算 算法
Spark快速大数据分析PDF下载读书分享推荐
《Spark快速大数据分析》适合初学者,聚焦Spark实用技巧,同时深入核心概念。作者团队来自Databricks,书中详述Spark 3.0新特性,结合机器学习展示大数据分析。Spark是大数据分析的首选工具,本书助你驾驭这一利器。[PDF下载链接][1]。 ![Spark Book Cover][2] [1]: https://zhangfeidezhu.com/?p=345 [2]: https://i-blog.csdnimg.cn/direct/6b851489ad1944548602766ea9d62136.png#pic_center
187 1
Spark快速大数据分析PDF下载读书分享推荐
|
7月前
|
移动开发 分布式计算 Spark
Spark的几种去重的原理分析
Spark的几种去重的原理分析
144 0
|
7月前
|
机器学习/深度学习 SQL 分布式计算
Apache Spark 的基本概念和在大数据分析中的应用
介绍 Apache Spark 的基本概念和在大数据分析中的应用
266 0
|
7月前
|
机器学习/深度学习 SQL 分布式计算
介绍 Apache Spark 的基本概念和在大数据分析中的应用。
介绍 Apache Spark 的基本概念和在大数据分析中的应用。
|
7月前
|
SQL 分布式计算 HIVE
Spark数据倾斜问题分析和解决
Spark数据倾斜问题分析和解决
94 0
|
2月前
|
SQL 分布式计算 Serverless
EMR Serverless Spark:一站式全托管湖仓分析利器
本文根据2024云栖大会阿里云 EMR 团队负责人李钰(绝顶) 演讲实录整理而成
169 2
|
2月前
|
设计模式 数据采集 分布式计算
企业spark案例 —出租车轨迹分析
企业spark案例 —出租车轨迹分析
98 0
|
5月前
|
弹性计算 分布式计算 Serverless
全托管一站式大规模数据处理和分析Serverless平台 | EMR Serverless Spark 评测
【7月更文挑战第6天】全托管一站式大规模数据处理和分析Serverless平台 | EMR Serverless Spark 评测
23727 42
|
7月前
|
SQL 分布式计算 监控
基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用
本文演示了使用 EMR Serverless Spark 产品搭建一个日志分析应用的全流程,包括数据开发和生产调度以及交互式查询等场景。
56606 7
基于阿里云 EMR Serverless Spark 版快速搭建OSS日志分析应用
|
6月前
|
机器学习/深度学习 数据采集 分布式计算
基于spark的大数据分析预测地震受灾情况的系统设计
基于spark的大数据分析预测地震受灾情况的系统设计
168 1
下一篇
DataWorks