Spark

首页 标签 Spark
# Spark #
关注
9105内容
书评:《大数据处理之道》大数据热门技术遍历
《大数据处理之道》,用深入浅出的语言,系统的讲解了当前流行的大数据软件Hadoop, Spark, Storm, Dremel/Drill,MapReduce, HDFS, Hive, Hbase, Pig, ZooKeeper等等,涵盖了目前几乎所有的大数据热门技术,十分推荐!
[Spark][Python]PageRank 程序
PageRank 程序: file contents: page1 page3 page2 page1 page4 page1 page3 page1 page4 page2 page3 page4 def computeContribs(neighbors,rank):     for nei.
【Spark Summit East 2017】加速云上Spark基因测序的数据驱动方法以及案例研究
本讲义出自Lucy Lu与Eric Kaczmarek在Spark Summit East 2017上的演讲,主要介绍了正在研发中的基于Spark的编程平台GATK4(Genome Analysis Toolkit version 4 ),并用案例讲解了如何在云上配置Spark集群加速对于基因序列的测序工作。
【Spark Summit East 2017】从容器化Spark负载中获取的经验
本讲义出自Tom Phelan在Spark Summit East 2017上的演讲,Tom Phelan探讨了如何实现高可用性的分布式大数据应用和数据中心主机,并分享了学到的经验教训,并对于如何在一个可靠的、可伸缩的、高性能的环境将大数据应用程序容器化给出了一些提示。
Flink 的新方向在哪里?这场顶级盛会给出了答案
导读:Flink Forward是由Apache官方授权,Apache Flink 商业公司dataArtisans(Flink核心作者创办)发起,阿里巴巴、 Uber、Airbnb、Netflix等公司参与的国际型会议。日前Flink Forward柏林会议刚刚闭幕,今天,我们一起分享会议内容。
免费试用