开发者社区数据库文章正文

Presto 0.175 发布，Facebook 大数据查询引擎

2017-07-10 1475

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

Presto 0.175 发布了，Presto 是 Facebook 开源的数据查询引擎，可对250PB以上的数据进行快速地交互式分析，查询的速度达到商业数据仓库的级别。据称该引擎的性能是 Hive 的 10 倍以上。

Presto 可以查询包括 Hive、Cassandra 甚至是一些商业的数据存储产品。单个 Presto 查询可合并来自多个数据源的数据进行统一分析。

部分更新如下：

将 mongodb.connection-per-host 配置选项重命名为 mongodb.connections-per-host

添加对 INT 的支持，作为 INTEGER 数据类型的别名

将 INTERVAL 数据类型支持添加到 avg（）和 sum（）聚合函数

添加 enable_intermediate_aggregations 会话属性，以便在未分组的聚合中使用中间聚合

减少涉及 ORDER BY 的某些查询的内存利用率

文章标签：

云原生大数据计算服务 MaxCompute

大数据

SQL

NoSQL

HIVE

存储

关键词：

云原生大数据计算服务 MaxCompute引擎

云原生大数据计算服务 MaxCompute查询

云原生大数据计算服务 MaxCompute查询引擎

presto云原生大数据计算服务 MaxCompute引擎

presto Facebook

相关实践学习

基于MaxCompute的热门话题分析

Apsara Clouder大数据专项技能认证配套课程：基于MaxCompute的热门话题分析

怡雨@27

大熊计算机

12月前

存储缓存分布式计算

OSS大数据分析集成：MaxCompute直读OSS外部表优化查询性能（减少数据迁移的ETL成本）

MaxCompute直读OSS外部表优化方案，解决传统ETL架构中数据同步延迟高、传输成本大、维护复杂等问题。通过存储格式优化（ORC/Parquet）、分区剪枝、谓词下推与元数据缓存等技术，显著提升查询性能并降低成本。结合冷热数据分层与并发控制策略，实现高效数据分析。

大熊计算机

360 2 2

Echo_Wish

SQL 大数据数据挖掘

玩转大数据：从零开始掌握SQL查询基础

Echo_Wish

514 35 36

阿里云大数据

SQL 分布式计算数据挖掘

阿里云 MaxCompute MaxQA 开启公测，公测可申请 100CU 计算资源解锁近实时高效查询体验

阿里云云原生大数据计算服务 MaxCompute 推出 MaxQA（原 MCQA2.0）查询加速功能，在独享的查询加速资源池的基础上，对管控链路、查询优化器、执行引擎、存储引擎以及缓存机制等多个环节进行全面优化，显著减少了查询响应时间，适用于 BI 场景、交互式分析以及近实时数仓等对延迟要求高且稳定的场景。现正式开启公测，公测期间可申请100CU（价值15000元）计算资源用于测试，欢迎广大开发者及企业用户参与，解锁高效查询体验！

阿里云大数据

454 3 3

阿里云 MaxCompute MaxQA 开启公测，公测可申请 100CU 计算资源解锁近实时高效查询体验

小Lee

负载均衡大数据

大数据散列分区查询频率

小Lee

226 5 5

小Lee

存储大数据数据管理

大数据分区提高查询性能

小Lee

445 2 2

小Lee

存储负载均衡大数据

大数据水平分区提高查询性能

【11月更文挑战第2天】

小Lee

325 4 4

武子康

存储 JSON 监控

大数据-167 ELK Elasticsearch 详细介绍特点分片查询

武子康

999 4 4

阿里云大数据

存储分布式计算安全

MaxCompute Bloomfilter index 在蚂蚁安全溯源场景大规模点查询的最佳实践

MaxCompute 在11月最新版本中全新上线了 Bloomfilter index 能力，针对大规模数据点查场景，支持更细粒度的数据裁剪，减少查询过程中不必要的数据扫描，从而提高整体的查询效率和性能。

阿里云大数据

467 0 0

不吃核桃

关系型数据库 MySQL 分布式数据库

PolarDB 并行查询问题之大数据量的实时分析查询挑战如何解决

不吃核桃

246 2 2

花开富贵111

分布式计算资源调度 DataWorks

MaxCompute操作报错合集之出现“查询运行日志失败”的报错，一般是什么导致的

MaxCompute是阿里云提供的大规模离线数据处理服务，用于大数据分析、挖掘和报表生成等场景。在使用MaxCompute进行数据处理时，可能会遇到各种操作报错。以下是一些常见的MaxCompute操作报错及其可能的原因与解决措施的合集。

花开富贵111

302 3 3

Presto 0.175 发布，Facebook 大数据查询引擎

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

Presto 0.175 发布，Facebook 大数据查询引擎

热门文章

最新文章

相关课程

相关电子书