图解社交网络构建、信息扩散路径

简介:

我发现似乎没什么人真正了解社交网络是如何运作的,于是我决定写下这篇文章,以简明、不做作的方式阐明社交网络的内部运作原理(主要以LinkedIn领英为例)。

我想通过这篇文章为你提供一个理解社交网络的基本框架,并且你能据此向其他人讲解:社交网络是如何构建的?Influencer是什么?Lions是什么?信息是如何扩散的?为什么有的文章很热门,而有的文章却无人问津?

Social Networks Geography 社交网络地理


科学家们通常用一张成员之间的关系图来表示社交网络。


你也可以很容易地画出自己的社交网络图。请拿出一张白纸,首先画一个点表示自己,然后画出其他点表示和你关系近的人,之后给互相认识的人之间画上连线。

这就完成了!然后可以依次加上你朋友的朋友,朋友的朋友的朋友…..这图就越来越庞大了。


幸好我们生活在科技发达的21世纪,比如LinkedIn领英就可以提供工具帮你画出自己的社交网络,只需要几分钟而已,比你自己手工绘制快速有效多了。试试领英实验室的InMap吧。


我的InMap社交网络是这样的:


不得不说,第一眼看到这张图的时候,我就像首次踏上月球的宇航员一样新奇。看着这个陌生的新世界真是百感交集,既震惊又敬畏。回过神后,我迅速意识到这个形状奇怪的东西在一页之内就让我看到了我认识的人之间的联系,而我之前都从来没有注意过。


你也可以试试,这真的很神奇!


看看这个图的结构、层次,你很快就能在现代城市中找到类比:城中心(Center)、市郊(Outskirt)、公路和郊外(Suburbs)。

我用下面这个简图大致描述一个社交网络的通用结构:


城中心(Center)人员紧密,其外围是密度稍小的市郊(Outskirt);然后再往外,公路将分散的郊外(Suburbs)和主要网络区连接起来;而郊外又自己延伸分化成更小的个体,由小路连接起来。


你在谈论社交网络的时候就可以用上这个简易的模型。不过,要注意一个城市中心有所处地理位置清楚的定位,但是社交网络的中心是一个抽象的位置,一般是连接他人最密集的地方。


社交网络中的地图通过人际联系的密度衡量用户间距离,而不是物理上的位置。牢记这点。


大概知道社交网络上的地理之后,我们来看看人口结构。


Social Networks Demographics 社交网络的人口结构


社交网络里的居民和生活中的居民不是一个类型,但是你仍能找到相似之处。这两者都能基本划分为三个类别:神职人员(the clergy)、贵族(the nobility)、平民(the commoners)


这些人指的都是谁?


神职人员由所有的LinkedIn领英工作人员组成。他们维护这个网络,为整个网络设置规则,开发和推行新的系统。他们服务着领英上所有的教用户。目前领英拥有员工约 5,758 人!


贵族是由获得特殊权限的成员组成,他们在这个网络中人脉最广。他们就是所谓的Influencers。例如:理查德·布兰森(6,054,746 个粉丝),Deepak Chopra (3,188,426 粉丝),杰克·韦尔奇(3,158,157粉丝),比尔·盖茨 (2,374,231 粉丝),杰夫•韦纳(1,822,325 粉丝).....这些贵族们有多少人呢?活跃人数大概有300人。


而平民就是像你我这样的成员。到目前为止,领英约有3.13亿成员,其中有8400万是活跃用户。


你肯定会问,那什么是Lions呢?


Lions是一个特殊的类别,他们栖居在平民当中。他们通过在领英内尽可能多地连接其他用户而蓬勃发展。这些嗜好连接他人的"瘾君子"通常平均会有30,000个联系人,并会通过各种各样的方式与他人建立联系。


那他们都居住在什么地方呢?


我作了下图来表示:


从上图能看到,Influencers通常居住于城中心(拥有联系的密度最大),员工们则在市郊维持并活跃本地网络,Lions在郊区,你和我这样的平民也通常在郊区(联系人足够少的话也可能会在最外端边缘)。


这样我们大致明白了人口结构,下面我们来说说关系。


Social Networks Relationships社交网络中的关系


不同的人有不同的行为,据此让我们来回顾一下之前的三个分类:神职人员、贵族、平民。


神职人员(领英员工)通常在网络的背后默默服务,你很难看到关于他们的信息。他们会向特定几个居住在城中心的人物密切汇报。



贵族("Influencers")居住在城中心,他们拥有范围跨度最广泛的人脉,并由于其极多的联系人可以继续延伸向市郊和郊外。



平民(你和我)则常是在郊外的位置经营着我们由朋友和熟人组成的有限社交网络。我们大多局限在两到三个商业社区内(或者说是行业),并只能从身边扩展人脉。



最后是Lions,他们稍微有一点特殊,虽然他们的人脉可能很广,但也最杂。他们的很多联系人都处在整个网络的最外边缘,且关联性很差。这是Lions最主要的缺点之一,你虽然认识很多人,但是他们之间的关联太少。



到目前为止,你应该已经知道了一个社交网络的结构、有什么样的居民、他们之间的关系是什么。现在我们把这些内容结合在一起,组成“全局”。


Social Networks Dynamics 社交网络的动态性


上一节的内容稍有一点乏味,但是为了读懂接下来的内容还是必要的。依我的拙见,这是本文最有意思的一部分。


在前面我已经提到信息是如何在社交网络中推广传播的,但是你肯定还无法回答这些问题:信息是如何扩散的?为什么有的文章很热门,而有的文章则不?

我会同时解决这两个问题。


让我们首先来谈谈往下游的方向(即,从中心向边缘)


对一个"Influencer"来说,这就是信息扩散的典型方式。你肯定也发现了"Influencer"的文章经常置顶,而且他们似乎不会遇到任何阻力就可以不断的扩散他们的观点、文章、分享。



现在假设一个"Influencer"准备分享一个更新状态。


随着他点击鼠标,信息就涌向了网络,并首先在城中心扩散开来,然后一场火热的活动开始了。中心的人士相互扩散这条信息,接着社交网络里的市郊被激活,也开始相互扩散,然后照着这样的发展趋势,郊区很快也收到了这条信息。最后一阶段则是中心开始放缓,同时边缘却开始反响。


这就是信息如何顺着下游的方向传播的。


如果发布状态的人是你我这样靠近边缘的人呢?


那么这就全然不同了。你可能也注意到了,我故意选择了从中心到边缘这样的往下游的方向做说明,现在我会解释如果你往上游进发会发生什么。


你可能觉得这和游泳往上游差不多,那我就只能祝你好运了!和游泳不一样的是,在这里联系人密度是一个制约因素。


如果你向上游进发,会有两个不一样的结果。


首先,你的状态更新在本地周围扩散,然后被某个处于郊区的用户分享了,然后,有时候会有一些“神奇”的事情发生——你的状态被市郊的用户看上了,你就成功达到了中心。你完全无法想象之后会收到多少消息提示,你甚至还开始有了追随者。是的!处于中心的人士开始往下游扩散你的信息了!现在你就成了一个超级明星。


但是这真的只能是一个极少见的例外。



而另一种结果是,你往上游进发的道路遇到了阻碍!你的联系人可能忙、不感兴趣或者心情不好,没有扩散你的分享或文章。你状态的阅读量或评论量没有增加的趋势,然后这事就这么没下文了。


是的朋友,这就是最常见的情况。


社交网络可能一开始看起来极其复杂,极其随机,但是只要有合适的框架就能轻松理解了。


我希望你现在可以回答我在文章开头列出的那些难题了,并且希望你对社交网络的运行能有一个更好的理解。


原文发布时间为:2015-01-15

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
18天前
|
前端开发 JavaScript 开发者
JavaScript:构建动态网络的引擎
JavaScript:构建动态网络的引擎
|
3月前
|
机器学习/深度学习 算法 量子技术
GQNN框架:让Python开发者轻松构建量子神经网络
为降低量子神经网络的研发门槛并提升其实用性,本文介绍一个名为GQNN(Generalized Quantum Neural Network)的Python开发框架。
65 4
GQNN框架:让Python开发者轻松构建量子神经网络
|
14天前
|
算法 数据挖掘 区块链
基于遗传算法的多式联运车辆路径网络优优化研究(Matlab代码实现)
基于遗传算法的多式联运车辆路径网络优优化研究(Matlab代码实现)
|
18天前
|
人工智能 监控 数据可视化
如何破解AI推理延迟难题:构建敏捷多云算力网络
本文探讨了AI企业在突破算力瓶颈后,如何构建高效、稳定的网络架构以支撑AI产品化落地。文章分析了典型AI IT架构的四个层次——流量接入层、调度决策层、推理服务层和训练算力层,并深入解析了AI架构对网络提出的三大核心挑战:跨云互联、逻辑隔离与业务识别、网络可视化与QoS控制。最终提出了一站式网络解决方案,助力AI企业实现多云调度、业务融合承载与精细化流量管理,推动AI服务高效、稳定交付。
|
28天前
|
机器学习/深度学习 算法 搜索推荐
从零开始构建图注意力网络:GAT算法原理与数值实现详解
本文详细解析了图注意力网络(GAT)的算法原理和实现过程。GAT通过引入注意力机制解决了图卷积网络(GCN)中所有邻居节点贡献相等的局限性,让模型能够自动学习不同邻居的重要性权重。
119 0
从零开始构建图注意力网络:GAT算法原理与数值实现详解
|
6月前
|
边缘计算 安全 算法
阿里云CDN:构建全球化智能加速网络的数字高速公路
阿里云CDN构建全球化智能加速网络,拥有2800多个边缘节点覆盖67个国家,实现毫秒级网络延迟。其三级节点拓扑结构与智能路由系统,结合流量预测模型,确保高命中率。全栈式加速技术包括QUIC协议优化和Brotli压缩算法,保障安全与性能。五层防御机制有效抵御攻击,行业解决方案涵盖视频、物联网及游戏等领域,支持新兴AR/VR与元宇宙需求,持续推动数字内容分发技术边界。
399 13
|
3月前
|
监控 安全 Go
使用Go语言构建网络IP层安全防护
在Go语言中构建网络IP层安全防护是一项需求明确的任务,考虑到高性能、并发和跨平台的优势,Go是构建此类安全系统的合适选择。通过紧密遵循上述步骤并结合最佳实践,可以构建一个强大的网络防护系统,以保障数字环境的安全完整。
86 12
|
4月前
|
JSON 编解码 API
Go语言网络编程:使用 net/http 构建 RESTful API
本章介绍如何使用 Go 语言的 `net/http` 标准库构建 RESTful API。内容涵盖 RESTful API 的基本概念及规范,包括 GET、POST、PUT 和 DELETE 方法的实现。通过定义用户数据结构和模拟数据库,逐步实现获取用户列表、创建用户、更新用户、删除用户的 HTTP 路由处理函数。同时提供辅助函数用于路径参数解析,并展示如何设置路由器启动服务。最后通过 curl 或 Postman 测试接口功能。章节总结了路由分发、JSON 编解码、方法区分、并发安全管理和路径参数解析等关键点,为更复杂需求推荐第三方框架如 Gin、Echo 和 Chi。
|
5月前
|
机器学习/深度学习 网络架构
PINN应用案例:神经网络求解热扩散方程高质量近似解
本文探讨了物理信息神经网络(PINN)在求解一维热扩散方程中的应用,对比分析了多层感知器(MLP)、残差网络(ResNet)和Wang2020架构的性能。PINN通过构建损失函数整合偏微分方程残差、边界条件和初始条件,实现对物理系统的近似求解。实验结果表明,传统架构如MLP和ResNet虽能大致还原解析解,但在部分区域存在显著偏差;而Wang2020架构因专门设计以应对PINN训练挑战,表现更为优越,与解析解高度一致。研究还揭示了PINN训练中“平台期后突变”的优化特性,并提出通过构造满足约束条件的网络架构以简化多目标优化问题,为未来研究提供了新方向。
361 3
PINN应用案例:神经网络求解热扩散方程高质量近似解
|
5月前
|
监控 算法 JavaScript
基于 JavaScript 图算法的局域网网络访问控制模型构建及局域网禁止上网软件的技术实现路径研究
本文探讨局域网网络访问控制软件的技术框架,将其核心功能映射为图论模型,通过节点与边表示终端设备及访问关系。以JavaScript实现DFS算法,模拟访问权限判断,优化动态策略更新与多层级访问控制。结合流量监控数据,提升网络安全响应能力,为企业自主研发提供理论支持,推动智能化演进,助力数字化管理。
122 4

热门文章

最新文章