《Spark大数据处理：技术、应用与性能优化》——2.2　Spark集群初试-阿里云开发者社区

《Spark大数据处理：技术、应用与性能优化》——2.2　Spark集群初试

2017-07-03 953

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介：

本节书摘来自华章计算机《Spark大数据处理：技术、应用与性能优化》一书中的第2章，第2.2节,作者:高彦杰更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.2　Spark集群初试

假设已经按照上述步骤配置完成Spark集群，可以通过两种方式运行Spark中的样例。下面以Spark项目中的SparkPi为例，可以用以下方式执行样例。
1）以./run-example的方式执行
用户可以按照下面的命令执行Spark样例。

./bin/run-example  org.apache.spark.examples.SparkPi

2）以./Spark Shell的方式执行
Spark自带交互式的Shell程序，方便用户进行交互式编程。下面进入Spark Shell的交互式界面。

./bin/spark-shell
用户可以将下面的例子复制进Spark Shell中执行。
importscala.math.random
importorg.apache.spark._
objectSparkPi {
def main(args: Array[String]) {
  val slices = 2
  val n = 100000 * slices
  val count = sc.parallelize(1 to n， slices).map { i =>
  val x = random * 2 - 1
  val y = random * 2 - 1
  if (x*x + y*y < 1) 1 else 0
      }.reduce(_ + _)
  println("Pi is roughly " + 4.0 * count / n)
  }
}

按回车键执行上述命令。
注意，Spark Shell中已经默认将SparkContext类初始化为对象sc。用户代码如果需要用到，则直接应用sc即可，否则用户自己再初始化，就会出现端口占用问题，相当于启动两个上下文。
3）通过Web UI 查看集群状态
浏览器输入http://masterIP:8080，也可以观察到集群的整个状态是否正常，如图2-5所示。集群会显示与图2-5类似的画面。masterIP配置为用户的Spark集群的主节点IP。

fd69e5ed36d8697879be3f8c0e0cb35955a159aa

《Spark大数据处理：技术、应用与性能优化》——2.2　Spark集群初试

2.2　Spark集群初试

华章出版社

热门文章

最新文章

相关课程

相关电子书

探索云世界

热门

云计算

大数据

云原生

人工智能

数据库

开发与运维

活动广场

任务中心

训练营

直播

乘风者计划

下载

镜像站

技术资料

《Spark大数据处理：技术、应用与性能优化》——2.2 Spark集群初试

2.2 Spark集群初试

华章出版社

热门文章

最新文章

相关课程

相关电子书

《Spark大数据处理：技术、应用与性能优化》——2.2　Spark集群初试

2.2　Spark集群初试