开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 视频 > 正文

通过LLVM加速SparkSQL时间窗口计算

发布者:Dev-Talk 2020-07-08 16:34:00 1159
视频介绍

讲师介绍:

王太泽
第四范式特征工程数据库负责人
曾在百度担任资深研发工程师
一直致力于解决机器学习模型从离线到在线特征一致性问题和性能问题。

议题简介

  • 为什么要优化spark时间窗口
  • 未加速前面临问题
  • 为什么要使用llvm加速而不是继续优化jvm codegen
  • 实现介绍-llvm 版本sql引擎设计
  • 如何与spark集成
  • benchmark数据 vs spark3.0

阿里云EMR是云原生开源大数据平台,为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎,计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

+关注
Dev-Talk
文章
问答
视频
来源圈子
更多
邀请你加入钉钉群聊Apache Spark中国技术交流社区,点击进入查看详情 https://qr.dingtalk.com/action/joingroup?code=v1,k1,X7S/0/QcrLMkK7QZ5sw2oTvoYW49u0g5dvGu7PW+sm4=&_dt_no_comment=1&origin=11。</br> 微信公众号:Apache Spark技术交流社区 为 Spark 爱好者提供一个交流技术和传递资讯的平台,在这里你可以掌握大数据计算领域最前沿的资讯,可以与 Spark 技术大牛面对面交流,还有不定期社区福利领取哟~
+ 订阅

相关产品

  • 开源大数据平台 E-MapReduce
  • 相关文章
    更多