开发者学堂课程【大数据Spark2020最新课程(知识精讲与实战演练)第二阶段:RDD 算子_ Action _ foreach】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/689/detail/11981
RDD 算子_ Action _ foreach
内容介绍
一、前言
二、实例
一、前言
在前面的学习中,我们已经经常使用 collect。在调用 collect 时有一点点繁琐。有一个新的 Action算子可以直接调用,叫做 foreach 。
二、实例
接下来用一个小小的案例来了解一下 foreach。进入工具,创建新方法,定义 RDD ,调用 foreach ,求出数据,打印item 。这时点击 foreach 可以看到它的返回值是一个 Unit 。
然后运行代码,看看结果是如何的,
代码如下:
@Test
def foreach() : Unit = {
val rdd = sc.parallelize(Seq(1,2,3))
rdd.foreach(item => println(item))
}
我们可以看到,结果的打印顺序是132,与我们的认知有一点点不同,因为 item 的收集是一个异步的过程,需要大家注意。