Presto全网最佳学习资料汇总

简介: Presto这几年在国内使用的越来越广泛,成为企业中必备的Adhoc/BI报表/轻量级ETL引擎,国内公司比如阿里巴巴、滴滴、头条、京东、小米都有几百数上千台的Presto集群,这主要还是由Presto优秀的特性使然(下文详细说明)。为了方便咱们中国的Presto使用者、爱好者学习使用Presto,我把Presto周边的资料做了一个搜集整理,方便大家查阅。

Presto这几年在国内使用的越来越广泛,成为企业中必备的Adhoc/BI报表/轻量级ETL引擎,国内公司比如阿里巴巴、滴滴、头条、京东、小米都有几百数上千台的Presto集群,这主要还是由Presto优秀的特性使然(下文详细说明)。为了方便咱们中国的Presto使用者、爱好者学习使用Presto,我把Presto周边的资料做了一个搜集整理,方便大家查阅。

Presto的优点

如何说服你的老板使用Presto?

Presto本身很优秀: 首先Presto是一个全内存计算引擎,使得其速度特别的快;其次是它的灵活的插件机制,使得理论上可以从Presto联邦查询任意数据源,而社区默认的版本也已经自带了足够丰富的数据源,用户如果有自研的数据源,也可以开发相应的Connector进行链接;再者Presto实现的是完整的SQL语义,你不用担心某种语义是它不支持的,或者性能特别差,在SQL语义方面Presto是全能发展,而不是只专注一个方向(比如只专注单表查询性能);最后Presto有着活跃发展的社区,现在Presto有两个分支PrestoDB和PrestoSQL,两个分支都在活跃的发展带来了一些让人心动的新特性,比如对于TableScan的大幅度(Project Aria)。

Presto引擎设计符合大数据发展的趋势: 随着云计算的普及,网络带宽的持续加大,计算和存储分离的架构逐渐成为趋势,过去计算和存储一定要绑定在一起才能实现的查询性能现在计算和存储分离的架构下也是可以实现了,而Presto则是计算和存储分离的典型代表: Presto做计算,存储则是下面的各种Connector。这种架构演变的趋势让Presto得到越来越多的关注。

各大公司的实践

大家都在用。

书籍文献

在学术上Presto也是很牛的。

必读文章

来,先读点大家都爱看的。

资料网站

Presto的相关资料很多。

  • Presto官方网站

    • PrestoDB: 托管在Linux Fundation之下,Facebook、Twitter、阿里巴巴等等是其中的成员。因为大公司的场景锤炼,会有一些比较大的特性的规划和开发。
    • PrestoSQL: Starburst主导之下的一个分支,活跃度相对高一些。
  • Facebook Enginerring网站: Facebook关于Presto的一些开发进展在这个网站会有公布。
  • Presto中国知乎社区: 阿里云数据湖分析团队维护的Presto中国知乎社区,上面有大量的Presto源码分析文章。
  • Presto News公众号: 阿里云数据湖分析团队维护的Presto公众号,分享最新的Presto新闻、进展。

image.png

聊天群

进来聊聊吧,快速入门、解惑。

image.png

  • Presto China User Group(微信): 易观维护的一个微信群。

    • 很可惜,没有二维码,只可以邀请进群。

Presto as a Service

自己不想搭Presto? 可以直接用云服务。

Youtube频道

英文不错的、懂得**的可以看一看。

总结

这些资料是笔者整理,以供有Adhoc/BI报表/轻量级ETL需求的用户及Presto爱好者学习交流,以帮助大家更好的学习掌握这个引擎,大家如果有相关资料补充欢迎评论给我。

相关文章
|
11月前
|
分布式计算 监控 前端开发
《Apache Flink 案例集(2022版)》——2.数据分析——网易互娱-基于Flink 的支付环境全关联分析实践(上)
《Apache Flink 案例集(2022版)》——2.数据分析——网易互娱-基于Flink 的支付环境全关联分析实践(上)
135 0
|
11月前
|
运维 Kubernetes 数据可视化
《Apache Flink 案例集(2022版)》——2.数据分析——网易互娱-基于Flink 的支付环境全关联分析实践(下)
《Apache Flink 案例集(2022版)》——2.数据分析——网易互娱-基于Flink 的支付环境全关联分析实践(下)
140 0
|
SQL 数据可视化 关系型数据库
实践教程之使用PolarDB-X与Flink搭建实时数据大屏
PolarDB-X 为了方便用户体验,提供了免费的实验环境,您可以在实验环境里体验 PolarDB-X 的安装部署和各种内核特性。除了免费的实验,PolarDB-X 也提供免费的视频课程,手把手教你玩转 PolarDB-X 分布式数据库。 本期实验将指导您使用 PolarDB-X 与Flink搭建实时数据大屏。
实践教程之使用PolarDB-X与Flink搭建实时数据大屏
|
存储 SQL 分布式计算
淘菜菜×基于Flink和Hologres的高可用实时数仓架构升级之路
汪宇(旋宇) 阿里巴巴淘菜菜事业部 数据技术专家
淘菜菜×基于Flink和Hologres的高可用实时数仓架构升级之路
|
消息中间件 SQL 存储
Flink 引擎在快手的深度优化与生产实践
快手实时计算团队技术专家刘建刚在 FFA 2021 的演讲。
Flink 引擎在快手的深度优化与生产实践
|
SQL 关系型数据库 MySQL
体验有奖:使用PolarDB-X与Flink搭建实时数据大屏
场景将提供一台配置了CentOS 8.5操作系统的ECS实例(云服务器)。通过本教程的操作带您体验如何使用PolarDB-X与Flink搭建一个实时数据链路,模拟阿里巴巴双十一GMV大屏。
|
存储 数据可视化 Cloud Native
体验PolarDB-X与Flink搭建实时数据大屏
体验PolarDB-X与Flink搭建实时数据大屏
631 0
体验PolarDB-X与Flink搭建实时数据大屏
|
SQL 存储 分布式计算
《离线和实时大数据开发实战》(五)Hive 优化实践1
《离线和实时大数据开发实战》(五)Hive 优化实践1
383 0
《离线和实时大数据开发实战》(五)Hive 优化实践1
|
SQL 分布式计算 大数据
《离线和实时大数据开发实战》(五)Hive 优化实践2
《离线和实时大数据开发实战》(五)Hive 优化实践2
168 0
《离线和实时大数据开发实战》(五)Hive 优化实践2
|
SQL 缓存 分布式计算
《离线和实时大数据开发实战》(四)Hive 原理实践2
《离线和实时大数据开发实战》(四)Hive 原理实践2
273 0
《离线和实时大数据开发实战》(四)Hive 原理实践2