《异构信息网络挖掘: 原理和方法》—— 1.1 异构信息网络是什么

简介: 信息网络是现实世界的抽象,关注于对象以及对象之间的交互。事实证明,这一层次的抽象既具有表达和存储现实世界本质信息的强大能力,同时通过运用链接的信息,为从现实世界挖掘知识提供了一个有用的工具。形式上,我们如下定义一个信息网络。

本节书摘来自华章出版社《异构信息网络挖掘: 原理和方法法》一 书中的第1章,第1.1节,作者( 美)孙艺洲(Yizhou Sun),(美)韩家炜(Jiawei Han),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

1.1 异构信息网络是什么

    信息网络是现实世界的抽象,关注于对象以及对象之间的交互。事实证明,这一层次的抽象既具有表达和存储现实世界本质信息的强大能力,同时通过运用链接的信息,为从现实世界挖掘知识提供了一个有用的工具。形式上,我们如下定义一个信息网络。

_1_1

    不同于传统网络的定义,我们明确区分网络中的对象类型和关系类型。注意,如果类型A和类型B之间存在一个关系,记为A R B,那么,对于其逆关系R-1,自然有B R-1 A成立。通常,R和其逆R-1是不相等的,除非其链接的两个对象具有相同类型且R是对称的。当这些对象类型满足>1或者关系类型满足>1时,称这样的网络为异构信息网络;否则为同构信息网络。

    给定一个复杂的异构信息网络,为了更好地理解网络中的对象类型与链接类型,需要给出其元级别(即模式级别)的描述。因此,我们提出网络模式的概念来描述网络的元结构。

_1_2

    异构信息网络的网络模式限定了对象集合以及对象间关系的类型约束。这些约束使得异构信息网络具有半结构化的特点,引导着网络语义的探究。
异构信息网络可以由许多相互连接的、大规模的数据集来构造,范围涉及社会、科学、工程、商业应用等。以下是一些异构信息网络的例子。
    1)文献信息网络。文献信息网络,比如从DBLP中衍生出来的计算机科学文献信息网络,就是典型的异构网络。它包含4类实体:论文(P)、刊物(即会议/期刊)(V)、作者(A)和术语(T)。对于每一篇论文p∈P,都有到作者集合、刊物以及术语集合的链接,它们都属于链接类型的集合。论文p还可能包含一些论文的引用信息,即这些论文连接了论文p引用的论文或是引用论文p的论文。

文献网络的网络模式以及该网络的一个实例如图11所示。
4a71d48074b0d729a0d5dbd070729d694ed83a17

     2) Twitter信息网络。作为社交媒体,Twitter同样可以被看作是一个信息网络。它包括多种对象类型,如用户、推文、标签和术语,以及多种关系(或链接)类型,如用户之间的关注、用户与推文之间的发布、推文之间的回复、推文与术语之间的使用、推文与标签之间的包含。
    3) Flickr信息网络。照片分享网站Flickr可被视为一个信息网络,它的对象类型包括图片、用户、标签、分组、评论等,它的关系类型包括用户与图片之间的上传、图片与标签之间的包含、图片与分组之间的属于、用户与评论之间的发表、评论与图片之间的评论等。
    4) 医疗信息网络。医疗系统可被建模为一个医疗信息网络,它的对象类型包括医生、病人、疾病、治疗、设备等,它的关系类型包括治疗方案与疾病之间的使用、病人与疾病之间的患病、病人与医生之间的就诊等。
    几乎在所有领域都可以构建异构信息网络,这些领域包括:社交网络(如Facebook),电子商务(如Amazon和eBay),在线电影数据库(如IMDB)以及众多数据库应用。通过使用自然语言处理技术和其他先进技术提取实体和关系,异构信息网络也可以由文本数据(如新闻集合)构建。
    信息网络可以关联各类信息。信息网络中的节点和链接都可以附加属性。例如,在Twitter信息网络中,名词型或数值型的位置信息通常与一些用户和推文相关联。同样,节点和链接通常附加时间信息,从而反映信息网络的动态性。例如,在文献信息网络中,每年都有新的论文和作者,以及与他们相关的链接出现。这样的问题将在一些信息网络挖掘任务中得到解决。
相关文章
|
4月前
|
算法 JavaScript 数据安全/隐私保护
基于GA遗传优化的最优阈值计算认知异构网络(CHN)能量检测算法matlab仿真
本内容介绍了一种基于GA遗传优化的阈值计算方法在认知异构网络(CHN)中的应用。通过Matlab2022a实现算法,完整代码含中文注释与操作视频。能量检测算法用于感知主用户信号,其性能依赖检测阈值。传统固定阈值方法易受噪声影响,而GA算法通过模拟生物进化,在复杂环境中自动优化阈值,提高频谱感知准确性,增强CHN的通信效率与资源利用率。预览效果无水印,核心程序部分展示,适合研究频谱感知与优化算法的学者参考。
|
7月前
|
机器学习/深度学习 计算机视觉
RT-DETR改进策略【模型轻量化】| 替换骨干网络为 MobileViTv1高效的信息编码与融合模块,获取局部和全局信息
RT-DETR改进策略【模型轻量化】| 替换骨干网络为 MobileViTv1高效的信息编码与融合模块,获取局部和全局信息
340 62
RT-DETR改进策略【模型轻量化】| 替换骨干网络为 MobileViTv1高效的信息编码与融合模块,获取局部和全局信息
|
7月前
|
机器学习/深度学习 自然语言处理 计算机视觉
RT-DETR改进策略【Backbone/主干网络】| CVPR 2024 替换骨干网络为 RMT,增强空间信息的感知能力
RT-DETR改进策略【Backbone/主干网络】| CVPR 2024 替换骨干网络为 RMT,增强空间信息的感知能力
298 13
RT-DETR改进策略【Backbone/主干网络】| CVPR 2024 替换骨干网络为 RMT,增强空间信息的感知能力
|
7月前
|
机器学习/深度学习 计算机视觉
YOLOv11改进策略【模型轻量化】| 替换骨干网络为 MobileViTv1高效的信息编码与融合模块,获取局部和全局信息
YOLOv11改进策略【模型轻量化】| 替换骨干网络为 MobileViTv1高效的信息编码与融合模块,获取局部和全局信息
260 9
YOLOv11改进策略【模型轻量化】| 替换骨干网络为 MobileViTv1高效的信息编码与融合模块,获取局部和全局信息
|
7月前
|
计算机视觉
RT-DETR改进策略【卷积层】| CGblock 内容引导网络 利用不同层次信息,提高多类别分类能力 (含二次创新)
RT-DETR改进策略【卷积层】| CGblock 内容引导网络 利用不同层次信息,提高多类别分类能力 (含二次创新)
145 5
RT-DETR改进策略【卷积层】| CGblock 内容引导网络 利用不同层次信息,提高多类别分类能力 (含二次创新)
|
7月前
|
机器学习/深度学习 自然语言处理 计算机视觉
YOLOv11改进策略【Backbone/主干网络】| CVPR 2024 替换骨干网络为 RMT,增强空间信息的感知能力
YOLOv11改进策略【Backbone/主干网络】| CVPR 2024 替换骨干网络为 RMT,增强空间信息的感知能力
218 0
YOLOv11改进策略【Backbone/主干网络】| CVPR 2024 替换骨干网络为 RMT,增强空间信息的感知能力
|
7月前
|
计算机视觉
YOLOv11改进策略【卷积层】| CGblock 内容引导网络 利用不同层次信息,提高多类别分类能力 (含二次创新)
YOLOv11改进策略【卷积层】| CGblock 内容引导网络 利用不同层次信息,提高多类别分类能力 (含二次创新)
324 0
|
9月前
|
SQL 安全 网络安全
网络安全与信息安全:知识分享####
【10月更文挑战第21天】 随着数字化时代的快速发展,网络安全和信息安全已成为个人和企业不可忽视的关键问题。本文将探讨网络安全漏洞、加密技术以及安全意识的重要性,并提供一些实用的建议,帮助读者提高自身的网络安全防护能力。 ####
216 17
|
9月前
|
SQL 安全 网络安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将从网络安全漏洞、加密技术和安全意识三个方面进行探讨,旨在提高读者对网络安全的认识和防范能力。通过分析常见的网络安全漏洞,介绍加密技术的基本原理和应用,以及强调安全意识的重要性,帮助读者更好地保护自己的网络信息安全。
170 10
|
9月前
|
存储 SQL 安全
网络安全与信息安全:关于网络安全漏洞、加密技术、安全意识等方面的知识分享
随着互联网的普及,网络安全问题日益突出。本文将介绍网络安全的重要性,分析常见的网络安全漏洞及其危害,探讨加密技术在保障网络安全中的作用,并强调提高安全意识的必要性。通过本文的学习,读者将了解网络安全的基本概念和应对策略,提升个人和组织的网络安全防护能力。

热门文章

最新文章