Presto全网最佳学习资料汇总

简介: Presto这几年在国内使用的越来越广泛,成为企业中必备的Adhoc/BI报表/轻量级ETL引擎,国内公司比如阿里巴巴、滴滴、头条、京东、小米都有几百数上千台的Presto集群,这主要还是由Presto优秀的特性使然(下文详细说明)。为了方便咱们中国的Presto使用者、爱好者学习使用Presto,我把Presto周边的资料做了一个搜集整理,方便大家查阅。

Presto这几年在国内使用的越来越广泛,成为企业中必备的Adhoc/BI报表/轻量级ETL引擎,国内公司比如阿里巴巴、滴滴、头条、京东、小米都有几百数上千台的Presto集群,这主要还是由Presto优秀的特性使然(下文详细说明)。为了方便咱们中国的Presto使用者、爱好者学习使用Presto,我把Presto周边的资料做了一个搜集整理,方便大家查阅。

Presto的优点

如何说服你的老板使用Presto?

Presto本身很优秀: 首先Presto是一个全内存计算引擎,使得其速度特别的快;其次是它的灵活的插件机制,使得理论上可以从Presto联邦查询任意数据源,而社区默认的版本也已经自带了足够丰富的数据源,用户如果有自研的数据源,也可以开发相应的Connector进行链接;再者Presto实现的是完整的SQL语义,你不用担心某种语义是它不支持的,或者性能特别差,在SQL语义方面Presto是全能发展,而不是只专注一个方向(比如只专注单表查询性能);最后Presto有着活跃发展的社区,现在Presto有两个分支PrestoDB和PrestoSQL,两个分支都在活跃的发展带来了一些让人心动的新特性,比如对于TableScan的大幅度(Project Aria)。

Presto引擎设计符合大数据发展的趋势: 随着云计算的普及,网络带宽的持续加大,计算和存储分离的架构逐渐成为趋势,过去计算和存储一定要绑定在一起才能实现的查询性能现在计算和存储分离的架构下也是可以实现了,而Presto则是计算和存储分离的典型代表: Presto做计算,存储则是下面的各种Connector。这种架构演变的趋势让Presto得到越来越多的关注。

各大公司的实践

大家都在用。

书籍文献

在学术上Presto也是很牛的。

必读文章

来,先读点大家都爱看的。

资料网站

Presto的相关资料很多。
  • Presto官方网站

    • PrestoDB: 托管在Linux Fundation之下,Facebook、Twitter、阿里巴巴等等是其中的成员。因为大公司的场景锤炼,会有一些比较大的特性的规划和开发。
    • PrestoSQL: Starburst主导之下的一个分支,活跃度相对高一些。
  • Facebook Enginerring网站: Facebook关于Presto的一些开发进展在这个网站会有公布。
  • Presto中国知乎社区: 阿里云数据湖分析团队维护的Presto中国知乎社区,上面有大量的Presto源码分析文章。
  • Presto News公众号: 阿里云数据湖分析团队维护的Presto公众号,分享最新的Presto新闻、进展。

image.png

聊天群

进来聊聊吧,快速入门、解惑。
  • PrestoDB: prestodb.slack.com
  • Presto中国社区(钉钉群): 阿里云数据湖分析团队维护的Presto中国钉钉群。

image.png

  • Presto China User Group(微信): 易观维护的一个微信群。

    • 很可惜,没有二维码,只可以邀请进群。

Presto as a Service

自己不想搭Presto? 可以直接用云服务。

Youtube频道

英文不错的、懂得**的可以看一看。

总结

这些资料是笔者整理,以供有Adhoc/BI报表/轻量级ETL需求的用户及Presto爱好者学习交流,以帮助大家更好的学习掌握这个引擎,大家如果有相关资料补充欢迎评论给我。

相关文章
|
存储 监控 物联网
HBase全网最佳学习资料汇总
前言 HBase这几年在国内使用的越来越广泛,在一定规模的企业中几乎是必备存储引擎,互联网企业阿里巴巴、京东、小米都有数千台的HBase集群,中国电信的话单、中国人寿的保单都是存储在HBase中。注意大公司有数十个数百个HBase集群,此点跟Hadoop集群很不相同。
5818 0
|
人工智能 架构师 分布式数据库
2018年HBase生态社群画像 +最全资料汇总下载
2018年HBase生态社群画像 +最全资料汇总下载
16980 0
|
流计算
《基于Flink的美团点评实时计算平台实践和应用》电子版地址
基于Flink的美团点评实时计算平台实践和应用
189 0
《基于Flink的美团点评实时计算平台实践和应用》电子版地址
|
分布式数据库 Hbase
|
SQL 机器学习/深度学习 存储
大数据开发笔记(九):Flink综合学习)(一)
Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。并且 Flink 提供了数据分布、容错机制以及资源管理等核心功能。Flink提供了诸多高抽象层的API以便用户编写分布式任务
221 0
大数据开发笔记(九):Flink综合学习)(一)
|
SQL 消息中间件 缓存
大数据开发笔记(九):Flink综合学习)(二)
Flink 是一个框架和分布式处理引擎,用于对无界和有界数据流进行有状态计算。并且 Flink 提供了数据分布、容错机制以及资源管理等核心功能。Flink提供了诸多高抽象层的API以便用户编写分布式任务
295 0
大数据开发笔记(九):Flink综合学习)(二)
|
存储 SQL 机器学习/深度学习
《Apache Flink 案例集(2022版)》——3.机器学习——Bilibili-Flink 在 B 站的多元化探索与实践(2)
《Apache Flink 案例集(2022版)》——3.机器学习——Bilibili-Flink 在 B 站的多元化探索与实践(2)
180 0
|
机器学习/深度学习 存储 人工智能
《Apache Flink 案例集(2022版)》——3.机器学习——Bilibili-Flink 在 B 站的多元化探索与实践(3)
《Apache Flink 案例集(2022版)》——3.机器学习——Bilibili-Flink 在 B 站的多元化探索与实践(3)
206 0
|
消息中间件 机器学习/深度学习 SQL
《Apache Flink 案例集(2022版)》——3.机器学习——Bilibili-Flink 在 B 站的多元化探索与实践(1)
《Apache Flink 案例集(2022版)》——3.机器学习——Bilibili-Flink 在 B 站的多元化探索与实践(1)
188 0
|
机器学习/深度学习 流计算
《微博基于Flink的机器学习实践》电子版地址
4.微博基于Flink的机器学习实践_final_version_v2的副本
90 0
《微博基于Flink的机器学习实践》电子版地址

热门文章

最新文章