JindoTable数据湖之查询加速是什么?-问答-阿里云开发者社区-阿里云

开发者社区> Lee_tianbai> 正文

JindoTable数据湖之查询加速是什么?

来自:阿里云EMR 2021-01-07 15:49:22 278 1

JindoTable数据湖之查询加速是什么?

取消 提交回答
全部回答(1)
  • Lee_tianbai
    2021-01-08 15:47:49

    JindoTable 还有一项重磅功能,就是查询加速功能。在数仓中,数据分析总是越快越 好。尤其是 Ad-Hoc 场景,对查询延迟非常敏感。现在“湖仓一体”的概念也很火,对于 数据湖这种普遍使用存储计算分离场景的架构,如何尽可能减少 IO 开销,对于缩短查询 时间是非常关键的。 之前介绍的 JindoTable 数据优化功能,是在存储端减少额外开销,并且通过提前的 计算,为运行时优化打好基础。JindoTable 的查询加速功能则是在查询执行时,通过把计 算推向存储,减少计算时整体的 IO 压力,同时利用存储端空闲的计算资源提供高效的计 算,缩短整体查询时间。JindoTable 的加速服务结合修改后的各种计算引擎,可以把尽可 能多的算子下推到缓存端,并且利用高效的 native 计算能力过滤大量原始数据,再把数据 高效地传输给计算引擎。这样,计算引擎所需处理的数据大大减少,甚至一些计算也可以直 接略过,后续的计算所需的时间自然也就大为减少。

    image.png

    0 0
相关问答

3

回答

怎样进钉钉2个群

游客6bdmn27yntop2 2020-03-12 13:30:20 3457浏览量 回答数 3

2

回答

阿里云云原生数据库是什么,有什么作用?

Lee_tianbai 2021-01-07 15:15:47 817浏览量 回答数 2

1

回答

如果开传奇,同时在线4-5个版本需要什么配置云服务器多少带宽

木茶 2020-10-09 20:01:18 992浏览量 回答数 1

2

回答

什么是数据湖?

Lee_tianbai 2021-01-07 15:17:49 707浏览量 回答数 2

1

回答

数据湖要解决的三大问题是什么?

Lee_tianbai 2021-01-07 16:35:06 788浏览量 回答数 1

1

回答

阿里云DataWorks是如何解决元数据管理问题的?

Lee_tianbai 2021-01-07 16:36:21 1177浏览量 回答数 1

1

回答

阿里云DataWorks是如何解决数据集成问题的?

Lee_tianbai 2021-01-07 16:37:07 819浏览量 回答数 1

1

回答

阿里云DataWorks是如何解决数据开发问题的?

Lee_tianbai 2021-01-07 16:38:51 871浏览量 回答数 1

1

回答

为什么说数据湖是大数据和 AI 时代融合存储和计算的全新体系?

Lee_tianbai 2021-01-07 15:09:16 779浏览量 回答数 1

1

回答

常见的 CDC 方案实现之binlog 实时同步是什么?

Lee_tianbai 2021-01-07 16:25:07 714浏览量 回答数 1
+关注
0
文章
1008
问答
来源圈子
更多
E-MapReduce是构建于阿里云ECS弹性虚拟机之上,利用开源大数据生态系统,包括Hadoop和Spark,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。加入钉钉群聊阿里云E-MapReduce交流2群,点击进入查看详情 https://qr.dingtalk.com/action/joingroup?code=v1,k1,cNBcqHn4TvG0iHpN3cSc1B86D1831SGMdvGu7PW+sm4=&_dt_no_comment=1&origin=11
+ 订阅
推荐问答
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载