文档备案控制台

开发者社区 > 大数据与机器学习 > 开源大数据平台 E-MapReduce > 视频 > 正文

Spark Shuffle RPMem扩展: 借助持久内存与RDMA加速Spark 数据分析

发布者：Dev-Talk 2020-10-26 15:52:00 2563

Dev-Talk

+关注

视频介绍

Spark Shuffle RPMem扩展提供了一个基于PMem 和RDMA 来加速Shuffle的方案，它采用PMem 作为Shuffle的存储介质，利用PMDK 用户态编程库进行数据读写，减小用户态、内核态切换与文件系统开销；用基于RDMA网络协议异构的传输层实现高性能数据传输；还将RDMA直接注册在PMem上，减少内存拷贝。
本次直播介绍如何利用持久化内存与高性能RDMA 网络来加速Spark Shuffle。

讲师介绍：

张建，英特尔亚太研发有限公司大数据部门的软件工程经理，专注于大数据和机器学习中存储方案优化

关键词：

技术数据分析

医疗数据分析

大数据数据分析

构建数据分析data agent开发实践

构建数据分析实践

相关视频

大数据与机器学习

开源大数据平台 E-MapReduce

+关注

阿里云EMR是云原生开源大数据平台，为客户提供简单易集成的Hadoop、Hive、Spark、Flink、Presto、ClickHouse、StarRocks、Delta、Hudi等开源大数据计算和存储引擎，计算资源可以根据业务的需要调整。EMR可以部署在阿里云公有云的ECS和ACK平台。

热门文章

热门讨论

展开全部

展开全部

+关注

Dev-Talk

文章

问答

视频

来源圈子

更多

Apache Spark 中国技术社区

4460

邀请你加入钉钉群聊Apache Spark中国技术交流社区，点击进入查看详情 https://qr.dingtalk.com/action/joingroup?code=v1,k1,X7S/0/QcrLMkK7QZ5sw2oTvoYW49u0g5dvGu7PW+sm4=&_dt_no_comment=1&origin=11。</br> 微信公众号：Apache Spark技术交流社区为 Spark 爱好者提供一个交流技术和传递资讯的平台，在这里你可以掌握大数据计算领域最前沿的资讯，可以与 Spark 技术大牛面对面交流，还有不定期社区福利领取哟～

+ 订阅

相关产品

开源大数据平台 E-MapReduce

文档详情产品详情

相关文章

更多

阿里云服务器计算型c8i、通用型g8i、内存型r8i实例测评与价格参考阿里云服务器实例规格vCPU、内存、网络带宽、网络收发包PPS、连接数等性能指标详解阿里云服务器ECS内存型r8i、通用算力u1、r7、AMD内存r8a、高主频内存hfr8i价格和性能差异阿里云服务器计算型、通用型、内存型主要实例规格性能特点和适用场景汇总阿里云服务器CPU内存配置怎么选？ECS实例规格有啥区别？新手程序员如何阿里云服务器配置？新人开发者CPU内存带宽存储怎么选？阿里云2核4G服务器支持多少人在线？程序效率、并发数、内存CPU性能、公网带宽多因素阿里云服务器实例规格选择参考：经济型、通用算力型、计算型、通用型、内存型区别【Spark Summit East 2017】使用开源大数据软件构建实时防欺诈引擎专访阿里云高级技术专家吴威：Kafka、Spark和Flink类支持流式计算的软件会越来越流行