《中国人工智能学会通讯》——3.2 基于网络结构信息的网络表示方法

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第3章,第3.2节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

3.2 基于网络结构信息的网络表示方法

基于网络结构信息的网络表示方法只考虑网络节点之间的链接关系。给定网络图 G=(V, E)。其中V 表示网络中的节点集合;E 是网络中的边集合image网络表示学习的目的在于从网络信息中学习得到各个节点的低维表示image是向量的维度。

这部分分别介绍 DeepWalk、LINE 和 GraRep三种模型。其中 DeepWalk 是以 Skip-gram 模型为基础,本质上使用了二阶的网络上下文信息;LINE模型显示地提出了网络表示方法的目标函数,考虑了一阶和二阶的上下文信息;GraRep 对 LINE 模型进行了拓展,可以对节点的任意阶上下文信息建模。

DeepWalk 模型

DeepWalk 模型首先采用随机游走 (randomwalk) 的方法产生标准的输入序列,然后使用 Skip-gram 模型对序列建模得到网络节点表示(具体算法见表 1)。随机游走首先基于均匀分布得到序列的起始点,然后从当前点的邻居节点中随机选择一点作为后续节点,依次迭代直到产生特定长度的序列。image
相比基准的模型方法 (Spectral Clustering [7] 、Modularity [8] 、EdgeCluster [22] 、wvRN [23] ),DeepWalk 模型有效地解决了训练数据稀疏的问题,在训练数据较少的情况下,F 1 值上有 10% 的提高。在一些标准数据集中,仅使用 60% 的训练数据 DeepWalk 模型就可以超过使用 100% 训练数据的所有基准方法。

LINE 模型

文献 [17] 提出了一种适用于不同类别网络图结构(有向图、无向图和加权图)的网络学习模型LINE。具体上,LINE 模型从一阶相似性 (first-orderproximity) 和二阶相似性 (second-order proximity)两方面设计目标函数。基于一阶或者二阶相似性,LINE 模型可以分别学习到一种网络表示。为了同时使用这两种相似性,LINE 模型将一阶节点向量和二阶节点向量拼接起来作为最终的节点表示。

一阶相似性表示网络中两个节点之间的点对相似性,具体为节点之间边的权重(如果点对不存在边,则其一阶相似性为 0)。为了建模一阶相似性,模型首先定义点对 υ i 和 υ j 联合概率为image
其中 和 分别是节点υ i 和节点υ j 的向量表示。节点υ i 和υ j 的经验联合概率为image表示边 (i, j) 上的权重,image 。一阶相似性模型通过最小化概率分布 image的KL距离来获得网络表示。

二阶相似性模型假设如果节点间共享相似的邻居节点,那么两者就趋于相似。具体上,点对之间的二阶相似性表示两个节点在整个网络上的一阶相似性的分布相似度(如果点对没有共同的相邻节点,则二阶相似性为 0)。在这种情况下,每个节点有目标节点和其他节点的上下文两个角色。形式上,用 和 分别指 υ i 作为目标节点的表示和 υ i 作为其他节点上下文的表示。二阶相似性模型首先定义节点 υ i 和 υ j 的条件概率为image
节点 υ i 和 υ j 的经验条件概率image,其中 d i是节点 υ i 的出度。通过最小化概率分布与之间的 KL 距离来获得二阶相似性模型的网络表示。

一阶相似性和二阶相似性模型都采用了基于边的负采样优化方法来得到网络节点表示。实验表明LINE 模型在语言网络、社交网络和论文引用网络的数据集上均超过了 DeepWalk 模型和基于随机梯度的矩阵分解方法[24] 。

GraRep 模型

文献 [18] 指出 LINE 模型中的一阶相似性和二阶相似性分别捕捉到节点间一阶和二阶的局部信息(如图 1(a)和(b)所示),并在此基础上提出更一般化的模型 GraRep。GraRep 模型可以捕捉更高阶的网络信息(如图 1(c)和(d)所示),并对每一阶的局部信息分别建模,最后串接各阶网络表示得到最终节点表示。image
GraRep 模型基于概率转移矩阵来获得网络表示。首先定义一阶概率转移矩阵 A=D -1 S,其中 S 为邻接矩阵(S ij =wei ij )、D 为度对角矩阵 (degreematrix)。所得到的A ij 是节点υ i 到υ j 的一阶转移概率。进一步,通过计算 可以得到 k 阶概率转移矩阵。GraRep 模型优化目标在于最大化 (c, w) 对的出现概率,同时最小化随机产生的 (c', w) 出现的概率,其中 w 为目标词、c 是 w 的上下文词、c' 是随机得到的上下文词。采用负采样的方法建模 k 阶信息,考虑 (c, w) 的出现概率,最大化的目标函数为image
其中 表示从 w 到 c 的 k 步转移概率;σ(·)是 sigmoid 函数;λ 是负例的个数;上下文词c出现的概率为 image根据文献[25],优化上述式子本质上等价于将矩阵Y分解成W和C,其中 W 的每一行代表节点的表示,而 C 中的每一列表示节点作为上下文的表示。

GraRep 模型采用 SVD 矩阵分解的方法来得到网络节点的表示。相比 DeepWalk 和 LINE 模型,GraRep 模型考虑了更高阶的上下文信息,在网络结构数据上得到了更好的效果。值得一提的是,虽然在文献 [18] 中,GraRep 模型使用了复杂度较高的 SVD 矩阵分解的方法,但它也可以采用随机梯度下降的优化方法,因此该模型同样适用于大规模的网络结构。

相关文章
|
27天前
|
人工智能 自然语言处理 物联网
GEO优化方法有哪些?2025企业抢占AI流量必看指南
AI的不断重塑传统的信息入口之际,用户的搜索行为也从单一的百度、抖音的简单的查找答案的模式,逐渐转向了对DeepSeek、豆包、文心一言等一系列的AI对话平台的更加深入的探索和体验。DeepSeek的不断迭代优化同时,目前其月活跃的用户已破1.6亿,全网的AI用户规模也已超过6亿,这无疑为其下一阶段的迅猛发展提供了坚实的基础和广泛的市场空间。
|
6月前
|
机器学习/深度学习 人工智能 算法
智创 AI 新视界 -- 提升 AI 推理速度的高级方法(16 - 2)
本文深度聚焦提升 AI 推理速度,全面阐述模型压缩(低秩分解、参数量化)、硬件加速(GPU、TPU)及推理算法优化(剪枝感知推理、动态批处理)。结合图像识别等多领域案例与丰富代码示例,以生动形象且专业严谨的方式,为 AI 从业者提供极具价值的技术指南,助力突破 AI 推理速度瓶颈,实现系统性能跃升。
|
2月前
|
人工智能 数据安全/隐私保护 异构计算
桌面版exe安装和Python命令行安装2种方法详细讲解图片去水印AI源码私有化部署Lama-Cleaner安装使用方法-优雅草卓伊凡
桌面版exe安装和Python命令行安装2种方法详细讲解图片去水印AI源码私有化部署Lama-Cleaner安装使用方法-优雅草卓伊凡
330 8
桌面版exe安装和Python命令行安装2种方法详细讲解图片去水印AI源码私有化部署Lama-Cleaner安装使用方法-优雅草卓伊凡
|
2月前
|
机器学习/深度学习 人工智能 自然语言处理
如何让AI更“聪明”?VLM模型的优化策略与测试方法全解析​
本文系统解析视觉语言模型(VLM)的核心机制、推理优化、评测方法与挑战。涵盖多模态对齐、KV Cache优化、性能测试及主流基准,助你全面掌握VLM技术前沿。建议点赞收藏,深入学习。
527 8
|
2月前
|
人工智能
AI推理方法演进:Chain-of-Thought、Tree-of-Thought与Graph-of-Thought技术对比分析
大语言模型推理能力不断提升,从早期的规模扩展转向方法创新。2022年Google提出Chain-of-Thought(CoT),通过展示推理过程显著提升模型表现。随后,Tree-of-Thought(ToT)和Graph-of-Thought(GoT)相继出现,推理结构由线性链条演进为树状分支,最终发展为支持多节点连接的图网络。CoT成本低但易错传,ToT支持多路径探索与回溯,GoT则实现非线性、多维推理,适合复杂任务。三者在计算成本与推理能力上形成递进关系,推动AI推理向更接近人类思维的方向发展。
212 4
|
3月前
|
人工智能 JSON 监控
从零开始构建AI Agent评估体系:12种LangSmith评估方法详解
AI Agent的评估需覆盖其整个生命周期,从开发到部署,综合考量事实准确性、推理路径、工具选择、结构化输出、多轮对话及实时性能等维度。LangSmith作为主流评估平台,提供了一套全面的评估框架,支持12种评估技术,包括基于标准答案、程序性分析及观察性评估。这些技术可有效监控Agent各组件表现,确保其在真实场景中的稳定性和可靠性。
1577 0
从零开始构建AI Agent评估体系:12种LangSmith评估方法详解
|
10月前
|
机器学习/深度学习 人工智能 算法
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
眼疾识别系统,本系统使用Python作为主要开发语言,基于TensorFlow搭建卷积神经网络算法,并收集了4种常见的眼疾图像数据集(白内障、糖尿病性视网膜病变、青光眼和正常眼睛) 再使用通过搭建的算法模型对数据集进行训练得到一个识别精度较高的模型,然后保存为为本地h5格式文件。最后使用Django框架搭建了一个Web网页平台可视化操作界面,实现用户上传一张眼疾图片识别其名称。
530 5
基于Python深度学习的眼疾识别系统实现~人工智能+卷积网络算法
|
7月前
|
数据采集 人工智能 缓存
深挖“全栈智算”之力 中兴通讯开启AI普惠新纪元
深挖“全栈智算”之力 中兴通讯开启AI普惠新纪元
233 1

热门文章

最新文章