稳赚不赔~Spark社区招募志愿者!

本文涉及的产品
EMR Serverless StarRocks,5000CU*H 48000GB*H
简介: 可能是21世纪唯一不看颜值只看人品的招募

首先了解下这是个什么组织

Apache Spark是大数据方面最大的开源社区之一,拥有来自250多个组织的超过1000个贡献者,以及遍布全球570多个地方的超过30万个Spark Meetup社区成员。

在中国,阿里云计算平台EMR团队组织了为国内Spark开发者服务的Spark中国技术交流社区,运营了专门的社群、技术圈和公众号Apache Spark技术交流社区,用于分享和交流Spark相关信息。目前我们完全公益的服务于超过1w的国内开发者。这中间也得到了国内外的互联网大厂,举个栗子:Databricks,领英,蚂蚁金服,Intel等多家技术团队的支持。感兴趣微信关注公众号了解
公众号.jpg

Spark社区招募志愿者

活儿少礼多:

送书
送衣服
送杯子
送水壶
送书包
送贴纸
送门票
送鼠标垫
送公仔

但凡是 Spark 社区周边都!可!以!
(别的社区周边我也可以去偷点)

送大佬微信
送大佬钉钉号
送线下活动前排位置
送不打码资源
送一手招聘信息
送简历绿色通道
送劲爆八卦

按劳送礼,多劳多得,绝对公平。

也就是整理整理稿子,排排版,有活动时协助维持一下纪律。

可能是21世纪唯一不看颜值只看人品的招募。

有兴趣加志愿打工钉钉群:

开业活动
第5名,第15名,第25名,第35名进群的兄弟直接发红包
IMG_2373.JPG

相关实践学习
基于EMR Serverless StarRocks一键玩转世界杯
基于StarRocks构建极速统一OLAP平台
快速掌握阿里云 E-MapReduce
E-MapReduce 是构建于阿里云 ECS 弹性虚拟机之上,利用开源大数据生态系统,包括 Hadoop、Spark、HBase,为用户提供集群、作业、数据等管理的一站式大数据处理分析服务。 本课程主要介绍阿里云 E-MapReduce 的使用方法。
相关文章
|
SQL 存储 分布式计算
2019年Apache Spark技术交流社区原创文章回顾
整理了这一年分享过的来自诸多专家的实践经验,希望2020年我们仍然能够互相支持,壮大Spark社区。
5173 0
2019年Apache Spark技术交流社区原创文章回顾
|
机器学习/深度学习 分布式计算 搜索推荐
从跨国投行到开源社区,IBM Spark总工程师Nick Pentreath的传奇经历
最近,随着 2016 机器学习行业应用国际峰会的举办,Pentreath 来到了北京。机器之心受邀对他进行了独家专访,我们一起聊了聊 Spark 的新版本、IBM 的开源精神、不同平台的竞争关系,以及他在高盛的传奇经历,其中不乏爆料和精彩的观点分享。让我们看看 Pentreath 是怎么说的。
129 0
从跨国投行到开源社区,IBM Spark总工程师Nick Pentreath的传奇经历
|
分布式计算 数据可视化 IDE
5月21日 Spark 社区直播【Spark on Zeppelin】
Apache Zeppelin 是一个交互式的大数据开发Notebook,从一开始就是为Spark定制的。Zeppelin Notebook的开发环境与传统IDE开发环境相比有几大优势:不需要编译Jar,环境配置简单,交互式开发,数据结果可视化等等。 本次直播将会介绍Spark on Zeppelin的一些基本使用方式以及应用场景。
5月21日 Spark 社区直播【Spark on Zeppelin】
|
存储 机器学习/深度学习 分布式计算
10月29日社区直播【Spark Shuffle RPMem扩展: 借助持久内存与RDMA加速Spark 数据分析】
介绍如何利用持久化内存与高性能RDMA 网络来加速Spark Shuffle。
10月29日社区直播【Spark Shuffle RPMem扩展: 借助持久内存与RDMA加速Spark 数据分析】
|
机器学习/深度学习 分布式计算 并行计算
10月15日社区直播【Intel MLlib:构建平台优化的Spark机器学习】
Intel MLlib是一个为Apache Spark MLlib优化的软件包。它在保持和Spark MLlib兼容的同时,在底层利用原生算法库来实现在CPU和GPU上的最优化算法,同时使用Collective Communication来实现效率更高的节点间通信。我们的初步结果表明,该软件包在最小化应用改动的基础上,可以极大地提升MLlib算法的性能。
10月15日社区直播【Intel MLlib:构建平台优化的Spark机器学习】
|
存储 SQL 分布式计算
9月10日 Spark 社区直播【利用持久内存提速Spark】
主要探讨如何在Spark上使用持久内存这一新技术来进一步提速性能。具体会介绍基于Plasma的共享内存方案来提速SQL数据源访问的性能以及利用持久内存扩展Spark现有内存磁盘存储层级来提速RDD cache在迭代式计算中的效果。
9月10日 Spark 社区直播【利用持久内存提速Spark】
|
SQL 存储 缓存
8月27日 Spark 社区直播【OAP Spark 优化介绍: 通过索引和缓存优化交互式查询性能】
简单介绍OAP的总体蓝图。同时详细介绍其中的一个具体优化,使用索引和缓存来解决交互式查询性能挑战。
8月27日 Spark 社区直播【OAP Spark 优化介绍: 通过索引和缓存优化交互式查询性能】
|
机器学习/深度学习 人工智能 分布式计算
7月23日社区直播【TFPark: Distributed TensorFlow in Production on Apache Spark】
TFPark是开源AI平台Analytics Zoo中一个模块,它的可以很方便让用户在Spark集群中分布式地进行TensorFlow模型的训练和推断。一方面,TFPark利用Spark将TensorFlow 定义的AI训练或推理任务无缝的嵌入到用户的大数据流水线中,而无需对现有集群做任何修改;另一方面TFPark屏蔽了复杂的分布式系统逻辑,可以将单机开发的AI应用轻松扩展到几十甚至上百节点上。本次分享将介绍TFPark的使用,内部实现以及在生产环境中的实际案例。
7月23日社区直播【TFPark: Distributed TensorFlow in Production on Apache Spark】
|
机器学习/深度学习 SQL 分布式计算
7月9日Spark社区直播【通过LLVM加速SparkSQL时间窗口计算】
为什么要优化spark时间窗口 - 未加速前面临问题 - 为什么要使用llvm加速而不是继续优化jvm codegen - 实现介绍-llvm 版本sql引擎设计 - 如何与spark集成 - benchmark数据 vs spark3.0
7月9日Spark社区直播【通过LLVM加速SparkSQL时间窗口计算】
|
机器学习/深度学习 SQL 分布式计算
6月23日 Spark 社区技术直播【半小时,将你的Spark SQL模型变为在线服务】
SparkSQL在机器学习场景中应用模型从批量到实时面临的问题 - SparkSQL 转换成实时执行成本高 - 离线特征和在线特征保持一致困难 - 离线效果与在线效果差距大 我们是如何解决这些问题 相对传统实现方式我们优势 SparkSQL实时上线demo
6月23日 Spark 社区技术直播【半小时,将你的Spark SQL模型变为在线服务】
下一篇
无影云桌面