Presto全网最佳学习资料汇总

简介: Presto这几年在国内使用的越来越广泛,成为企业中必备的Adhoc/BI报表/轻量级ETL引擎,国内公司比如阿里巴巴、滴滴、头条、京东、小米都有几百数上千台的Presto集群,这主要还是由Presto优秀的特性使然(下文详细说明)。为了方便咱们中国的Presto使用者、爱好者学习使用Presto,我把Presto周边的资料做了一个搜集整理,方便大家查阅。

Presto这几年在国内使用的越来越广泛,成为企业中必备的Adhoc/BI报表/轻量级ETL引擎,国内公司比如阿里巴巴、滴滴、头条、京东、小米都有几百数上千台的Presto集群,这主要还是由Presto优秀的特性使然(下文详细说明)。为了方便咱们中国的Presto使用者、爱好者学习使用Presto,我把Presto周边的资料做了一个搜集整理,方便大家查阅。

Presto的优点

如何说服你的老板使用Presto?

Presto本身很优秀: 首先Presto是一个全内存计算引擎,使得其速度特别的快;其次是它的灵活的插件机制,使得理论上可以从Presto联邦查询任意数据源,而社区默认的版本也已经自带了足够丰富的数据源,用户如果有自研的数据源,也可以开发相应的Connector进行链接;再者Presto实现的是完整的SQL语义,你不用担心某种语义是它不支持的,或者性能特别差,在SQL语义方面Presto是全能发展,而不是只专注一个方向(比如只专注单表查询性能);最后Presto有着活跃发展的社区,现在Presto有两个分支PrestoDB和PrestoSQL,两个分支都在活跃的发展带来了一些让人心动的新特性,比如对于TableScan的大幅度(Project Aria)。

Presto引擎设计符合大数据发展的趋势: 随着云计算的普及,网络带宽的持续加大,计算和存储分离的架构逐渐成为趋势,过去计算和存储一定要绑定在一起才能实现的查询性能现在计算和存储分离的架构下也是可以实现了,而Presto则是计算和存储分离的典型代表: Presto做计算,存储则是下面的各种Connector。这种架构演变的趋势让Presto得到越来越多的关注。

各大公司的实践

大家都在用。

书籍文献

在学术上Presto也是很牛的。

必读文章

来,先读点大家都爱看的。

资料网站

Presto的相关资料很多。
  • Presto官方网站

    • PrestoDB: 托管在Linux Fundation之下,Facebook、Twitter、阿里巴巴等等是其中的成员。因为大公司的场景锤炼,会有一些比较大的特性的规划和开发。
    • PrestoSQL: Starburst主导之下的一个分支,活跃度相对高一些。
  • Facebook Enginerring网站: Facebook关于Presto的一些开发进展在这个网站会有公布。
  • Presto中国知乎社区: 阿里云数据湖分析团队维护的Presto中国知乎社区,上面有大量的Presto源码分析文章。
  • Presto News公众号: 阿里云数据湖分析团队维护的Presto公众号,分享最新的Presto新闻、进展。

image.png

聊天群

进来聊聊吧,快速入门、解惑。
  • PrestoDB: prestodb.slack.com
  • Presto中国社区(钉钉群): 阿里云数据湖分析团队维护的Presto中国钉钉群。

image.png

  • Presto China User Group(微信): 易观维护的一个微信群。

    • 很可惜,没有二维码,只可以邀请进群。

Presto as a Service

自己不想搭Presto? 可以直接用云服务。

Youtube频道

英文不错的、懂得**的可以看一看。

总结

这些资料是笔者整理,以供有Adhoc/BI报表/轻量级ETL需求的用户及Presto爱好者学习交流,以帮助大家更好的学习掌握这个引擎,大家如果有相关资料补充欢迎评论给我。

相关文章
|
1月前
|
监控 Cloud Native BI
8+ 典型分析场景,25+ 标杆案例,Apache Doris 和 SelectDB 精选案例集(2024版)电子版上线
飞轮科技正式推出 Apache Doris 和 SelectDB 精选案例集 ——《走向现代化的数据仓库(2024 版)》,汇聚了来自各行各业的成功案例与实践经验。该书以行业为划分标准,辅以使用场景标签,旨在为读者提供一个高度整合、全面涵盖、分类清晰且易于查阅的学习资源库。
|
6月前
|
SQL 存储 关系型数据库
杨校老师课题之Hive数据仓库搭建1
杨校老师课题之Hive数据仓库搭建
86 0
|
6月前
|
SQL 存储 关系型数据库
杨校老师课题之Hive数据仓库搭建2
杨校老师课题之Hive数据仓库搭建
54 0
|
7月前
|
SQL 分布式计算 大数据
大数据面试题百日更新_Hive专题(Day12)
大数据面试题百日更新_Hive专题(Day12)
49 0
|
存储 分布式计算 大数据
《Databricks数据洞察:从入门到实践》电子版地址
Delta Lake 作为数据湖核心存储引擎方案能给企业带来诸多的优势。本书从技术基础介绍到场景应用实践,从大数据平台架构的演进、Delta Lake关键特性、实现原理,以及数据仓库、数据湖的优劣势,湖仓一体架构的应用等多方面解析Lakehouse架构和Delta Lake的应用优势。帮助读者入门数据湖Lakehouse以及部分spark相关应用。
93 0
《Databricks数据洞察:从入门到实践》电子版地址
|
流计算
《阿里新一代实时计算引擎 Blink技术解密》电子版地址
阿里新一代实时计算引擎 Blink技术解密
95 0
《阿里新一代实时计算引擎 Blink技术解密》电子版地址
|
流计算
《阿里新一代实时计算引擎Blink技术解密》电子版地址
阿里新一代实时计算引擎Blink技术解密
86 0
《阿里新一代实时计算引擎Blink技术解密》电子版地址
|
流计算
《基于Kubernates的流处理平台实践 ——Flink为例》电子版地址
基于Kubernates的流处理平台实践 ——Flink为例
94 0
《基于Kubernates的流处理平台实践 ——Flink为例》电子版地址
|
分布式数据库 Hbase
|
NoSQL 数据挖掘 分布式数据库
《第十二届 BigData NoSQL Meetup — 快手HBase在千亿级用户特征数据分析中的应用与实践》电子版地址
第十二届 BigData NoSQL Meetup — 快手HBase在千亿级用户特征数据分析中的应用与实践
130 0
《第十二届 BigData NoSQL Meetup — 快手HBase在千亿级用户特征数据分析中的应用与实践》电子版地址