更多精彩内容参见云栖社区大数据频道https://yq.aliyun.com/big-data;此外,通过Maxcompute及其配套产品,低廉的大数据分析仅需几步,详情访问https://www.aliyun.com/product/odps。
本讲义出自Dean Wampler在Spark Summit EU上的演讲,主要介绍了Scala在Spark上的使用,以及Scala能够在Spark上发挥的作用,并在讲义中提供在Spark上使用Scala的相关指导的网址。
Scala是一门多范式的编程语言,一种类似java的编程语言,设计初衷是实现可伸缩的语言 、并集成面向对象编程和函数式编程的各种特性。Scala与Spark的搭配可以称得上完美,Scala的两大优点:1.基于JVM,和Hadoop、YARN等集成比较容易;2.函数式编程语言,从对外API到对内实现上都更容易统一范式,都完美地符合Spark的要求。