Spark RangeDependency 区间依赖关系

简介: Spark RangeDependency 区间依赖关系Represents a one-to-one dependency between ranges of partitions in the parent and child RDDs.

Spark RangeDependency 区间依赖关系

  • Represents a one-to-one dependency between ranges of partitions in the parent and child RDDs.

更多资源

youtub视频演示

输入数据

c.txt

a bc
a  

a.txt

a b
c a

处理程序scala

package com.opensource.bigdata.spark.local.rdd.operation.dependency.narrow.n_02_RangeDependency

import com.opensource.bigdata.spark.local.rdd.operation.base.BaseScalaSparkContext

object Run3 extends BaseScalaSparkContext{

  def main(args: Array[String]): Unit = {
    val sc = pre()
    val rdd1 = sc.textFile("/opt/data/2/c.txt",2)
    val rdd2 = sc.textFile("/opt/data/2/a.txt",2)
    val rdd3 = rdd1.union(rdd2)

    println(rdd3.collect().mkString("\n"))

    sc.stop()
  }

}

数据处理图

RangeDependency依赖关系图

相关文章
|
4月前
|
SQL 分布式计算 Java
IDEA 打包 Spark 项目 POM 文件依赖
这是一个 Maven POM 示例,用于构建一个使用 Spark 与 Hive 的项目,目标是将数据从 Hive 导入 ClickHouse。POM 文件设置了 Scala 和 Spark 的依赖,包括 `spark-core_2.12`, `spark-sql_2.12`, 和 `spark-hive_2.12`。`maven-assembly-plugin` 插件用于打包,生成包含依赖的和不含依赖的两种 JAR 包。`scope` 说明了依赖的使用范围,如 `compile`(默认),`provided`,`runtime`,`test` 和 `system`。
|
4月前
|
存储 缓存 分布式计算
Spark学习--day04、RDD依赖关系、RDD持久化、RDD分区器、RDD文件读取与保存
Spark学习--day04、RDD依赖关系、RDD持久化、RDD分区器、RDD文件读取与保存
|
4月前
|
SQL 分布式计算 大数据
Hudi数据湖技术引领大数据新风口(三)解决spark模块依赖冲突
Hudi数据湖技术引领大数据新风口(三)解决spark模块依赖冲突
203 0
|
存储 缓存 分布式计算
Spark学习--3、WordCount案例、RDD序列化、RDD依赖关系、RDD持久化(二)
Spark学习--3、WordCount案例、RDD序列化、RDD依赖关系、RDD持久化(二)
|
存储 缓存 分布式计算
Spark学习--3、WordCount案例、RDD序列化、RDD依赖关系、RDD持久化(一)
Spark学习--3、WordCount案例、RDD序列化、RDD依赖关系、RDD持久化(一)
|
分布式计算 大数据 Scala
Spark 原理_逻辑图_窄依赖的分类_看源码 | 学习笔记
快速学习 Spark 原理_逻辑图_窄依赖的分类_看源码
86 0
Spark 原理_逻辑图_窄依赖的分类_看源码 | 学习笔记
|
分布式计算 大数据 Spark
Spark 原理_逻辑图_窄依赖的分类_分析 | 学习笔记
快速学习 Spark 原理_逻辑图_窄依赖的分类_分析
141 0
Spark 原理_逻辑图_窄依赖的分类_分析 | 学习笔记
|
分布式计算 大数据 Spark
Spark 原理_逻辑图_窄依赖_分析 | 学习笔记
快速学习 Spark 原理_逻辑图_窄依赖_分析
128 0
Spark 原理_逻辑图_窄依赖_分析 | 学习笔记
|
分布式计算 大数据 Spark
Spark 原理_逻辑图_窄依赖_案例 | 学习笔记
快速学习 Spark 原理_逻辑图_窄依赖_案例
74 0
Spark 原理_逻辑图_窄依赖_案例 | 学习笔记
|
分布式计算 大数据 Spark
Spark 原理_逻辑图_宽窄依赖判断 | 学习笔记
快速学习 Spark 原理_逻辑图_宽窄依赖判断
88 0
Spark 原理_逻辑图_宽窄依赖判断 | 学习笔记