统一识别_图计算| 学习笔记

简介: 快速学习统一识别_图计算

开发者学堂课程【2020版大数据实战项目之 DMP 广告系统(第七阶段)统一识别_图计算】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/682/detail/11840


统一识别_图计算

图计算本身在调用的时候比较简单,没有 API,所以本节简单介绍下什么是图计算。

首先可以看到相应的两个数据集:

)).toDF( colNames="id", "name","age")

一个叫做 vertexvertex 可以理解为一个点,点里的数据第一列是 id, 第二列是 name,第三列是 age,第二个数据集val edge = spark.createDataFrame(List( 

val edge = spark.createDataFrame(List(

("a","b", "friend"),

("b","c","follow"),

("c","b","fo1low"),

("f""c","follow"),

("e","f","follow"),

("e","d","friend"),

("d","a","friend"),

("a","e","friend")

)).toDF( colNames= "src","dst","relationship")

}

}

// edge 对应的是一个边,这个边里的数据有"src"一端,"dst"另一端目标,"relationship"关系,所以这个vertex 这个点描述的其实是一个人,这个人的 id、名字、年龄是多少,edge 其实是在描述。

人与人之间的关系,找到ABC的所有关系。

画一个简略的草图,

首先第一个是A,第二个B,第三个为C,接下来AB有关系,可以连一条线,BC有关系,连线,CD没有关系,fc没有关系,e""f",""e""d","d""a""a""e 都没有关系,只找有关系的ABBC。如果这样,C通过B也是可以找到A的。

 2022-11-22 (19).png

那么想通过一个顶点找到和所有点都关联的点需要怎么去找呢?

在写之前要导入两个 mailyilai,

<dependency>

<groupId>graphframes</groupId>

<artifactId>graphframes</artifactId>

<version>0.7.0-spark2.4-s_2.11</version>

</dependency>

<dependency>

<groupId>org.apache.spark</groupId>

<artifactId>spark-graphx_2.11</artifactId>

<version>${spark.version}</version>

</dependency)

这一串代码导入Pom.xml文件中,往下实现通过关系找到哪一些人是可以在一个团队里、那些人是相互有关系的需求,

spark.sparkContext.setCheckpointDir("checkpoint")

val graph = GraphFrame(vertex,edge).connectedComponents.run()

graph.show()

}

}

// 创建一个 GraphFrame,接收两个参数分别为 vertexedge,使用 connectedComponents划分团队关系,对图中所有点进行串联,还需调用 run 才可程序运行,获取到一张图 graph,使用 show 打印这张图,看其中信息,运行出结果后发现报错,

2022-11-22 (21).png

错误需要设置 CheckpointDir  的目录。所以在调用 run 之前,通过spark.sparkContext 来去设置一个 setCheckpointDir,目录称为"checkpoint"

此时再运行一遍发现还在报错,是因为 GraphFrame JsonDSL$ 有冲突,需要打开 pom 文件找到

<dependency>

<groupId>org.json4s</groupId>

<artifactId>json4s-jackson_2.11</artifactId>

version>3.6.6</version>

</dependency>

这个 jar 包进行删除可解决。

2022-11-22 (23).png

注意:顶点这个数据集当中必须有一列叫做 id,会按照这个 id 来进行联通,边“edge”这个数据集当中必须要有两列,"src""dst",边的两端。把能联系起来的点放到同一个 component 中。

相关文章
|
数据可视化 大数据 定位技术
I+关系网络分析发布,提供完整的可视化分析和关系引擎功能
I+关系网络分析是以OLP模型为核心,面向业务快速建模,为开发者和终端用户提供大数据关系计算引擎(含API服务)和可视化交互分析能力,面向安防、关税、银行、保险、互联网等提供的产品化方案。目前,I+关系网络分析已在阿里巴巴、蚂蚁金服集团内广泛应用于反欺诈、反作弊、反洗钱等风控业务。
4403 0
|
15天前
|
数据可视化 网络可视化
混合图形模型MGM的网络可预测性分析
混合图形模型MGM的网络可预测性分析
12 0
|
2月前
|
机器学习/深度学习 数据处理 API
视觉智能平台常见问题之通用图像打标位置报警告如何解决
视觉智能平台是利用机器学习和图像处理技术,提供图像识别、视频分析等智能视觉服务的平台;本合集针对该平台在使用中遇到的常见问题进行了收集和解答,以帮助开发者和企业用户在整合和部署视觉智能解决方案时,能够更快地定位问题并找到有效的解决策略。
30 4
视觉智能平台常见问题之通用图像打标位置报警告如何解决
|
9月前
|
机器学习/深度学习 自然语言处理 BI
FourIE:基于图卷积网络的跨任务实例表征交互和标签依赖的联合信息抽取模型
现有的信息抽取(IE)工作主要是分别解决四个主要任务(实体提及识别、关系抽取、事件触发词检测和论元抽取),无法从任务之间的相互依赖中获益。
80 2
|
图计算 开发者
统一识别_图计算| 学习笔记
快速学习统一识别_图计算
51 0
|
图计算 开发者 iOS开发
统一识别-标签聚合| 学习笔记
快速学习统一识别-标签聚合
70 0
统一识别-标签聚合| 学习笔记
|
开发者
统一识别_完成| 学习笔记
快速学习统一识别_完成
41 0
统一识别_完成| 学习笔记
|
机器学习/深度学习
GraphCL:基于数据增强的图对比学习
GraphCL:基于数据增强的图对比学习
582 0
GraphCL:基于数据增强的图对比学习
|
数据可视化 开发者 Python
其他辅助显示层完善折线图| 学习笔记
快速学习其他辅助显示层完善折线图
107 0
其他辅助显示层完善折线图| 学习笔记
|
机器学习/深度学习 人工智能 NoSQL
图计算是理解世界的新方式
哪种技术可以更精准建模人脑? 近日,蚂蚁图计算技术负责人陈文光博士受邀参加了2022极客公园创新大会并发表主旨演讲。陈文光认为,图计算以其丰富的表达能力,为处理复杂关系提供了一种全新的建模方式,也为更深刻地理解世界提供了一种有效工具。
145 0
图计算是理解世界的新方式