《Spark Cookbook 中文版》一导读-阿里云开发者社区

开发者社区> 大数据> 正文

《Spark Cookbook 中文版》一导读

简介: 随着Hadoop这个大数据平台的成功,用户的期望也水涨船高,他们既希望解决不同分析问题的功能提高,又希望减少延迟。由此,各类工具应运而生。Apache Spark这个可以解决所有问题的单一平台也出现在了Hadoop的大舞台上。


q1

前 言

Spark Cookbook 中文版
随着Hadoop这个大数据平台的成功,用户的期望也水涨船高,他们既希望解决不同分析问题的功能提高,又希望减少延迟。由此,各类工具应运而生。Apache Spark这个可以解决所有问题的单一平台也出现在了Hadoop的大舞台上。“Spark一出,谁与争锋”,它终结了需要使用多种工具来完成复杂挑战和学习曲线的局面。通过使用内存进行持久化存储和计算,Apache Spark避免了磁盘上的中间存储过程并将速度提高了100倍,并且提供了一个单一平台用来完成诸如机器学习、实时streaming等诸多分析作业。

目 录

第1章  [开始使用Apache Spark]()
1.1  [简介]()
1.2  [使用二进制文件安装Spark]()
1.3  [通过Maven构建Spark源码]()
1.4  [在Amazon EC2上部署Spark]()
1.5  [在集群上以独立模式部署Spark]()
1.6  [在集群上使用Mesos部署Spark]()
1.7  [在集群上使用YARN部署]()
1.8  [使用Tachyon作为堆外存储层]()
第2章 使用Spark开发应用
第3章 外部数据源
第4章 Spark SQL
第5章 Spark Streaming
第6章 机器学习——MLlib
第7章 监督学习之回归——MLlib
第8章 监督学习之分类——MLlib
第9章 无监督学习——MLlib
第10章 推荐系统
第11章 图像处理——GraphX
第12章 优化及调优

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

分享:
大数据
使用钉钉扫一扫加入圈子
+ 订阅

大数据计算实践乐园,近距离学习前沿技术

其他文章