《中国人工智能学会通讯》——3.6 跨网络链接预测的研究

简介: 本节书摘来自CCAI《中国人工智能学会通讯》一书中的第3章,第3.6节, 更多章节内容可以访问云栖社区“CCAI”公众号查看。

3.6 跨网络链接预测的研究

在线社交网络已取得飞速发展,众多网站,如Facebook(脸书)、Twitter 以及国内的新浪微博、人人网、腾讯网等迅速崛起。其中,Facebook 的用户数已经达到14亿,成为世界人口最多的“国家”,这些用户每月花在 Facebook 上的时间超过 6.4 亿分钟;Twitter 用户数也达到 6.4 亿。微信和微博是国内在线社交网络的两个代表,用户数也分别达到5.4 亿和 2.4 亿;阿里巴巴在双 11 节创下 24 小时912 亿元的成交额(见表 1)。
image

表 1 几个主要在线社交网站基本统计数据所有这些数据显示,在线社交网络已经成为网络信息空间和人类物理世界连接不可或缺的桥梁。在线社交网络发展的另一特点是百花齐放,这里1列出了近 400 个比较活跃的社交系统,用户分布在不同社交网络中,同时为了满足不同需求在不同社交网络中分别注册不同账号。一个初步统计表明,用户平均加入的社交网络数量是 8。针对美国用户的统计分析2表明,近 2/3 的美国成人使用如Facebook、Twitter、MySpace 或者 LinkedIn 等社交网络来和朋友、家人以及商业伙伴保持联络。从研究的角度,这一方面为研究提供了海量数据;另一方面由于用户数据分布异构在不同的社交网络,这也为研究带来很多新的挑战。其中一个技术挑战是,我们能设计一个方法将不同社交网络自动链接起来吗?该问题即跨网络链接集成(预测) [1] 。

跨网络链接预测事实上带来很多针对传统研究问题的思考。例如信息抽取,这是 Web 挖掘、自然语言处理、模式识别等多个领域的一个核心问题。传统的研究思路一般是首先找到目标页面,然后从其中抽取相关信息,如图 1(a) 所示,如果需要抽取Jeannette Wing 博士的个人信息,可以首先找到她的个人主页,然后从其中抽取职位、联系信息、教育经历等信息。然而在线社交网络的快速发展带来三个改变,第一个改变是这些语义信息更加异构且分布在不同数据源;第二个改变是信息更加结构化,很多信息在某些数据源可能是无结构,但在另一些数据源却已经是结构化的数据;第三个改变则是不同数据源数据的时效性不同。从跨网络链接预测的角度来看,获取信息的主要办法不再是单纯的抽取,而更重要的是如何自动链接不同数据源,并从其中识别哪些语义数据是有效的。例如 Talent 系统通过整合散落在多个网络的用户信息,为雇主提供了更全面的用户画像[2] 。图 1(b) 从网络的角度给出异构网络链接的示例,这表明在跨网络链接预测中,不仅需要考虑数据本身,还需要考虑网络拓扑结构,以及多个网络之间的一致性问题。
image

跨网络链接和传统单网络中的链接预测不同,链接预测是社交关系挖掘研究领域的一个重要研究课题,多年来受到多个领域的广泛关注。但目前大部分链接预测的研究对象是单一网络,主要预测和推荐单个网络中未知的链接,研究新链接的形成机理,讨论链接预测的方法、模型和应用。以手机通讯网络为例,在单个通讯网络内部可以预测用户和用户之间通信链接的建立;而跨网络链接预测,则可以通过某运营商内部用户的通信关系和部分与其他运营商用户的通信关系,成功地预测其竞争对手80% 以上的用户通信关系[3] 。通过主题模型,实现专利与产品的匹配,以及中英文 Wiki 页面匹配。对比传统方法,两个应用中分别可以提高 19.8% 及7.1% 的实体匹配准确率[4] 。

本文将从问题描述、主要方法和未来展望几个方面简要介绍跨网络链接预测问题的研究。

相关文章
|
15天前
|
机器学习/深度学习 人工智能 自动驾驶
什么是人工智能领域的卷积神经网络
什么是人工智能领域的卷积神经网络
20 0
|
1月前
|
机器学习/深度学习 人工智能 TensorFlow
人工智能与图像识别:基于卷积神经网络的猫狗分类器
人工智能与图像识别:基于卷积神经网络的猫狗分类器
28 0
|
2月前
|
机器学习/深度学习 人工智能 算法
基于机器视觉的害虫种类及计数检测研究-人工智能项目-附代码
基于机器视觉的害虫种类及计数检测研究-人工智能项目-附代码
43 0
|
1月前
|
机器学习/深度学习 人工智能 TensorFlow
人工智能与图像识别:基于深度学习的卷积神经网络
人工智能与图像识别:基于深度学习的卷积神经网络
34 0
|
7月前
|
传感器 机器学习/深度学习 算法
【WSN】无线传感器网络模拟器研究Matlab代码实现
【WSN】无线传感器网络模拟器研究Matlab代码实现
【WSN】无线传感器网络模拟器研究Matlab代码实现
|
19天前
|
机器学习/深度学习 人工智能 自然语言处理
什么是人工智能的神经网络
什么是人工智能的神经网络
12 0
|
1月前
|
消息中间件 网络协议 API
Python语言的进程通讯及网络
Python语言的进程通讯及网络
|
6月前
|
机器学习/深度学习 人工智能 算法
人工智能之从零理解人工神经网络
人工智能并非是一个新型的词汇,从十九世纪五十年代开始,人们就开始探索为机器赋予类似人的智能能力。限于当时的基础数学理论不够完善,人工智能的发展并不顺利。直到九十年代发展出了基于统计学的数学工具,人工智能才得到飞速的发展。
178 5
人工智能之从零理解人工神经网络
|
2月前
|
机器学习/深度学习 人工智能 API
人工智能应用工程师技能提升系列2、——TensorFlow2——keras高级API训练神经网络模型
人工智能应用工程师技能提升系列2、——TensorFlow2——keras高级API训练神经网络模型
33 0
|
2月前
|
机器学习/深度学习 存储 人工智能
存内计算芯片研究进展及应用—以基于NorFlash的卷积神经网络量化及部署研究突出存内计算特性
存内计算芯片研究进展及应用—以基于NorFlash的卷积神经网络量化及部署研究突出存内计算特性
101 3