【Hadoop Summit Tokyo 2016】云上SQL-on-Hadoop的状态

简介: 本讲义出自Nicolas Poggi在Hadoop Summit Tokyo 2016上的演讲,在演讲中首先介绍了BSC 与ALOJA以及PaaS服务概览,之后介绍了SQL基准以及PaaS服务的演进变化,最后分享了从云上的SQL-on-Hadoop中获取的经验。

本讲义出自Nicolas Poggi在Hadoop Summit Tokyo 2016上的演讲,在演讲中首先介绍了BSC 与ALOJA以及PaaS服务概览,之后介绍了SQL基准以及PaaS服务的演进变化,最后分享了从云上的SQL-on-Hadoop中获取的经验。

cafc518624945eac324652614d13ba825bd79cae

f7d7d2ed401e3f142d0e2617395887743c0fd085

569fbadd50bfef33ff38a7ec96ae5239fd7f224d

502157b8d7469b691b921284630a02ed24ec377a

bc297263c2accc963b645021f60a743bb03d00ab

b31459bdf2856331a761857e9f07826972655f3a

2074005ad7f091833cafdb5d07f9ddbe8c6423da

13ed47111122a7494dde116bccaea20c1aed3950

20bbc6cb4bee21ccafb97ae06a825f5b46a87e69

ffe8c91852212a96badbb8901a613cf9e2e55351

193bc2ca3cc00b12e90a8be235215918377ec1a6

68a41a6621af2b4d70542e22e3f8571e55d8f313

16da81659cd5fc659f4cb0024ec32df3702388db

6fc030c8577fdd5a30cc5dff8930f0402b7c5725

3b679a1947eee987c29d507e37c83d4b39878d64

f0f47d3d790f0b0afba573055bb9185b24663591

2fa453ac0314542d19b42aa99d3d48565197a80c

5a89609fc48572e425381bfe137d3fc46338a296

15bc2ff2b2d033f50875125a87de1aef716f9429

d0839354c9f6b5519bc0ff21f2486ab91b1de408

f9cea795c6832f79faceada7a7e282c784503d67

ccd3db6b6e16c43b2f653bf8d42fc8cfc4c26954

93d0a82fdec8b5126bafd754e53c92adcee0b386

4cd9cee6878033de6d983d978dc4f2fcbff51f61

752acf433b53f7308ddeca115b14f3d0fe485c7c

2bab5407457c5fa2902bbc64e66f438b1a260c5a

802a484668506c31f05cb81a130692c7509fb904

2f08a3bb1f6e6c97857a67b2d5fdfce71031fb0c

a5c40c0cd7d2f21c91827119bd3a94ea1a47e8e7

c8ce839d7794148d42c22852ddb5c974cb9281e2

4cc40700259a5b2e90169889f1713098b9b0c61d

52a9baf0b2b2f74ab650346d8fceea641649e347

f14edf39690d92e9cb74afb4098a4f078e983ee0

742e434a2193e807ce7c3195967feb9890acb7b0

4d182182c2c440fe00ccb6850515371190847831

3b19b64e1c25111b9cd33a578879d2979188b865

e0b8b652045a7e5d5c9a889262c9343570c1927b



相关文章
|
分布式计算 Hadoop 测试技术
|
机器学习/深度学习 分布式计算 Hadoop
满满的技术干货!Hadoop顶级会议Apache Hadoop Summit精华讲义分享
Apache Hadoop Summit是Hadoop技术的顶级会议,这里大咖云集,一同探讨世界上最新的Hadoop发展动态以及产品应用和技术实践。本文整理了Apache Hadoop Summit Tokyo 2016上的精选演讲的讲义,无论是你想要的是Hadoop发展前沿,是Hadoop优化技
5724 0
|
分布式计算 资源调度 Hadoop
【Hadoop Summit Tokyo 2016】操纵云上基于Hadoop 集群的YARN
本讲义出自Abhishek Modi在Hadoop Summit Tokyo 2016上的演讲,主要介绍了Qubole的Hadoop技术、Qubole的架构设计、短生命周期的Hadoop集群的相关内容以及面对的挑战以及YARN的自动扩展和不断发展的HDFS技术。
1931 0
|
分布式计算 Hadoop
【Hadoop Summit Tokyo 2016】如何构建成功的数据湖泊
本讲义出自 Alex Gorelik在Hadoop Summit Tokyo 2016上的演讲,主要介绍了数据湖泊的相关概念,介绍了数据湖泊可以赋能数据驱动的决策制定以及最大化商业价值,以及如何通过正确的数据+正确的平台+正确的接口构建成功的数据湖泊。
1566 0
|
分布式计算 Hadoop 流计算
【Hadoop Summit Tokyo 2016】像搭乐高一样搭建Storm与Spark Streaming Pipelines块
本讲义出自Arun Murthy在Hadoop Summit Tokyo 2016上的演讲,主要介绍了Arun Murthy与团队的从各种流使用中学习到的最佳实践和经验,演讲的内容非常简单易懂并且非常有趣,在演讲的最后还介绍了像搭乐高一样搭建Storm与Spark Streaming Pipelines块的相应工具。
2467 0
|
存储 分布式计算 Hadoop
【Hadoop Summit Tokyo 2016】将HDFS演化成为广义存储子系统
本讲义出自Sanjay Radia在Hadoop Summit Tokyo 2016上的演讲,主要介绍了HDFS的相关知识以及HDFS的过去以及未来发展的动机,分享了HDFS的优势所在以及面对的主要挑战,并分享了弹性的HDFS以及泛化存储层的存储容器。
2285 0
|
分布式计算 安全 Hadoop
【Hadoop Summit Tokyo 2016】Apache Spark & Apache Zeppelin的安全状态
本讲义出自Vinay Shukla在Hadoop Summit Tokyo 2016上的演讲,主要介绍了 Spark的安全体系、以及YARN AM上的Spark驱动以及Kerberos身份验证等相关内容,最后还介绍了SparkSQL的相关内容。
2906 0
|
分布式计算 Hadoop Apache
【Hadoop Summit Tokyo 2016】Apache Storm中的资源感知调度
本讲义出自Jerry Peng在Hadoop Summit Tokyo 2016上的演讲,主要介绍了Apache Storm的相关知识内容、目前遇到的挑战和问题并且对于资源感知调度器进行了详细介绍。
1910 0
|
29天前
|
存储 分布式计算 Hadoop
大数据处理架构Hadoop
【4月更文挑战第10天】Hadoop是开源的分布式计算框架,核心包括MapReduce和HDFS,用于海量数据的存储和计算。具备高可靠性、高扩展性、高效率和低成本优势,但存在低延迟访问、小文件存储和多用户写入等问题。运行模式有单机、伪分布式和分布式。NameNode管理文件系统,DataNode存储数据并处理请求。Hadoop为大数据处理提供高效可靠的解决方案。
57 2
|
29天前
|
分布式计算 Hadoop 大数据
大数据技术与Python:结合Spark和Hadoop进行分布式计算
【4月更文挑战第12天】本文介绍了大数据技术及其4V特性,阐述了Hadoop和Spark在大数据处理中的作用。Hadoop提供分布式文件系统和MapReduce,Spark则为内存计算提供快速处理能力。通过Python结合Spark和Hadoop,可在分布式环境中进行数据处理和分析。文章详细讲解了如何配置Python环境、安装Spark和Hadoop,以及使用Python编写和提交代码到集群进行计算。掌握这些技能有助于应对大数据挑战。