开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 视频 > 正文

OAP Spark 优化介绍: 通过索引和缓存优化交互式查询性能

发布者:Dev-Talk 2020-08-25 14:27:41 1100
视频介绍

讲师介绍:

陈海锋,英特尔亚太研发有限公司大数据部门的高级软件架构师,开发经理,主要研究和关注基于Hadoop和Spark的大数据框架的分析和优化,Apache社区的长期贡献者。

沈祥翔,英特尔亚太研发有限公司大数据部门的高级软件工程师,主要担任OAP项目的开发。

分享介绍:

简单介绍OAP的总体蓝图。同时详细介绍其中的一个具体优化,使用索引和缓存来解决交互式查询性能挑战。英特尔和社区合作,为Spark SQL实现了索引和数据源缓存,通过为关键查询列创建并存储完整的B +树索引,并使用智能的细粒度数据缓存策略,我们可以极大的提升基于Spark SQL的交互式查询的性能。


阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。
+关注
Dev-Talk
文章
问答
视频
来源圈子
更多
邀请你加入钉钉群聊Apache Spark中国技术交流社区,点击进入查看详情 https://qr.dingtalk.com/action/joingroup?code=v1,k1,X7S/0/QcrLMkK7QZ5sw2oTvoYW49u0g5dvGu7PW+sm4=&_dt_no_comment=1&origin=11。</br> 微信公众号:Apache Spark技术交流社区 为 Spark 爱好者提供一个交流技术和传递资讯的平台,在这里你可以掌握大数据计算领域最前沿的资讯,可以与 Spark 技术大牛面对面交流,还有不定期社区福利领取哟~
+ 订阅

相关产品

  • 开源大数据平台 E-MapReduce
  • 相关文章
    更多