《异构信息网络挖掘: 原理和方法》—— 1.2 为什么异构网络挖掘是一项新的挑战

简介: 已设计出许多方法用于分析同构信息网络,特别是在社交网络[1]领域,已有排名、社区探测、链接预测、影响分析等方法。然而,这些方法中的大多数并不能直接应用于异构信息网络挖掘。这不仅是因为连接不同类型实体的异构链接可能携带不一样的语义,还因为一般情况下,异构信息网络比同构网络具有更加丰富的信息。

本节书摘来自华章出版社《异构信息网络挖掘: 原理和方法法》一 书中的第1章,第1.2节,作者( 美)孙艺洲(Yizhou Sun),(美)韩家炜(Jiawei Han),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.2 为什么异构网络挖掘是一项新的挑战

    已设计出许多方法用于分析同构信息网络,特别是在社交网络[1]领域,已有排名、社区探测、链接预测、影响分析等方法。然而,这些方法中的大多数并不能直接应用于异构信息网络挖掘。这不仅是因为连接不同类型实体的异构链接可能携带不一样的语义,还因为一般情况下,异构信息网络比同构网络具有更加丰富的信息。通常,对异构信息网络进行投影可以得到同构信息网络,但是这样会明显地丢失信息。例如,对一个完整的异构文献网络在合作者信息上进行投影,可以得到一个合作者网络。然而,这样的投影会丢失作者在什么主题、哪些论文上进行了合作的重要信息。此外,基于异构信息网络中所蕴含的丰富的异构信息,许多强大、新颖的数据挖掘功能被设计出来,用于发现隐藏在实体间异构链接中的丰富信息。
    为什么异构网络挖掘是一项新的挑战?显然,信息在异构节点和链接间的传播与其在同构节点和链接间的传播可能相当不一样。根据我们对异构信息网络的研究,特别是我们关于基于排名的聚类[66;69]、基于排名的分类[30;31]、基于元路径相似性搜索[65]、关系预测[62;63]、关系强度学习[61;67]和网络演化[68]这些研究,使得我们确信存在一组能够引导对异构信息网络进行系统分析的新原理。我们将它们总结如下。
    1)异构链接间的信息传播。类似于大多数的网络分析研究,链接应被用于信息传播。然而,一个新的问题是
如何在异构类型的节点和链接间传播信息,特别地,在异构节点和链接间如何计算排名分数、相似性分数,聚类,以及充分利用类标签。无论我们如何制定新的、巧妙的度量、定义和方法,黄金原则是网络中的对象是相互依存的,且知识只能通过网络的整体信息来进行挖掘。
    2)基于网络元结构探索的搜索和挖掘。不同于同构信息网络中把对象和链接要么看作是相同类型,要么看作是无类型的节点和链接,在我们的模型中,异构信息网络是半结构且有类型的,即与信息网络中的节点和链接相关联的类型集合的结构形成了网络模式。网络模式提供了信息网络的元结构。这种模式提供了对网络进行搜索和挖掘的指导,有助于分析、理解网络中对象和关系的语义。本书随后介绍的基于元路径的相似性搜索和挖掘能展现网络元结构探索的价值与能力。
    3)用户引导的信息网络探索。在异构信息网络中,往往存在大量的、跨多个对象类型的语义关系,它们携带着并不明显的语义差异。给定用户的一个应用,可能关系或元路径的某个特定加权组合对其是最适合的。因此,对于基于用户引导或反馈的特定的搜索或挖掘任务来说,自动选择关系(或元路径)组合的恰当权重通常是很有必要的。基于用户引导或反馈的网络探索是一个有用的策略。

相关文章
|
5月前
|
机器学习/深度学习 PyTorch TensorFlow
卷积神经网络深度解析:从基础原理到实战应用的完整指南
蒋星熠Jaxonic,深度学习探索者。深耕TensorFlow与PyTorch,分享框架对比、性能优化与实战经验,助力技术进阶。
|
6月前
|
机器学习/深度学习 算法 调度
14种智能算法优化BP神经网络(14种方法)实现数据预测分类研究(Matlab代码实现)
14种智能算法优化BP神经网络(14种方法)实现数据预测分类研究(Matlab代码实现)
492 0
|
5月前
|
监控 负载均衡 安全
WebSocket网络编程深度实践:从协议原理到生产级应用
蒋星熠Jaxonic,技术宇宙中的星际旅人,以代码为舟、算法为帆,探索实时通信的无限可能。本文深入解析WebSocket协议原理、工程实践与架构设计,涵盖握手机制、心跳保活、集群部署、安全防护等核心内容,结合代码示例与架构图,助你构建稳定高效的实时应用,在二进制星河中谱写极客诗篇。
WebSocket网络编程深度实践:从协议原理到生产级应用
|
6月前
|
机器学习/深度学习 人工智能 算法
卷积神经网络深度解析:从基础原理到实战应用的完整指南
蒋星熠Jaxonic带你深入卷积神经网络(CNN)核心技术,从生物启发到数学原理,详解ResNet、注意力机制与模型优化,探索视觉智能的演进之路。
587 11
|
5月前
|
机器学习/深度学习 数据采集 边缘计算
基于灰色神经网络的预测方法
基于灰色神经网络的预测方法
345 0
|
6月前
|
机器学习/深度学习 算法 搜索推荐
从零开始构建图注意力网络:GAT算法原理与数值实现详解
本文详细解析了图注意力网络(GAT)的算法原理和实现过程。GAT通过引入注意力机制解决了图卷积网络(GCN)中所有邻居节点贡献相等的局限性,让模型能够自动学习不同邻居的重要性权重。
1143 0
从零开始构建图注意力网络:GAT算法原理与数值实现详解
|
6月前
|
安全 测试技术 虚拟化
VMware-三种网络模式原理
本文介绍了虚拟机三种常见网络模式(桥接模式、NAT模式、仅主机模式)的工作原理与适用场景。桥接模式让虚拟机如同独立设备接入局域网;NAT模式共享主机IP,适合大多数WiFi环境;仅主机模式则构建封闭的内部网络,适用于测试环境。内容简明易懂,便于理解不同模式的优缺点与应用场景。
882 0
|
6月前
|
算法 Python
【EI复现】考虑网络动态重构的分布式电源选址定容优化方法(Matlab代码实现)
【EI复现】考虑网络动态重构的分布式电源选址定容优化方法(Matlab代码实现)
224 0
|
7月前
|
机器学习/深度学习 数据采集 TensorFlow
基于CNN-GRU-Attention混合神经网络的负荷预测方法(Python代码实现)
基于CNN-GRU-Attention混合神经网络的负荷预测方法(Python代码实现)
391 0
|
8月前
|
机器学习/深度学习 人工智能 PyTorch
零基础入门CNN:聚AI卷积神经网络核心原理与工业级实战指南
卷积神经网络(CNN)通过局部感知和权值共享两大特性,成为计算机视觉的核心技术。本文详解CNN的卷积操作、架构设计、超参数调优及感受野计算,结合代码示例展示其在图像分类、目标检测等领域的应用价值。
471 7