社交图谱分析:激发大数据时代新活力

简介: 社交网络把互联网转化成为一个复杂的关系网,社交图谱分析提供了一种了解这种关系的方法。Facebook CEO马克·扎克伯格最早提出社交图谱这样一概念,它是一种表明“我认识你”的网络图谱。它反映了用户通过各种途径认识的人:家庭成员、工作同事、开会结识的朋友、高中同学、俱乐部成员、朋友的朋友等等。
0.jpg

社交网络把互联网转化成为一个复杂的关系网,社交图谱分析提供了一种了解这种关系的方法。Facebook CEO马克·扎克伯格最早提出社交图谱这样一概念,它是一种表明“我认识你”的网络图谱。它反映了用户通过各种途径认识的人:家庭成员、工作同事、开会结识的朋友、高中同学、俱乐部成员、朋友的朋友等等。社交图谱主要由一些主流的社交网络产生,用户向自己认识的人发送邀请来构建和维持他们的社会关系。

社交图谱模型是细粒度用户行为预测建模强有力的推动者,因为它能够更全面的结合群组、人际关系和影响力等语境明确潜在的个人行为。这些模型通过分析用户的行为和互动交流,提供客户体验详尽细微的观点。

在进行社交图谱分析时,如果你只对少数人感兴趣,分析工作会很简单。只需要调查他们之间的关系,或者挖掘与他们相关的行为数据即可。另一方面,如果你设法评估动态的行为模式,如地球上的每个人、每个地点、每件事之间可能的关系,加上他们可能对彼此谈话的内容,动态、实时、完美的预测他们未来的行为……这些都是不现实的,只能出现在科幻小说的幻想世界中。

世界正在逐渐意识到社交图谱分析的潜能,在公众、个人和研究机构扩大应用范围。它正在迅速发展成为一个大数据市场最有前途的细分领域,并成为各种商业和开源图形数据库(通常是NoSQL)的核心应用。在很多企业中,社交图谱分析已经在反欺诈、影响力分析、舆情监测、市场细分、参与优化、体验优化,以及其他需要快速确定复杂行为模式的领域成功应用。

为了激发更多的潜能,社交图谱分析产生的大数据源一触即发。在最基本的层面上,你可以模拟社交图谱,如节点与线路、实体与关系、个体与社会等形成的网络图。图形分析专家使用”vertex”和”edge”等术语做着类似的工作。有消息称,相关公共部门执行大规模并行图形分析的基础设施,包括4.4万亿节点(记录)和70万亿的边界(这些记录之间的关系)。Facebook自有社交图谱分析的基础设施能够处理数十亿节点和万亿级的边界。

可以想象一下,网络级图形分析正在自发的大规模运行,存储处理、内存、互连、数据中心的面积和功耗等,令其他任何大数据的部署变得相形见绌,它有以下四个方面的优势:一是可扩展性需求实现跨越式增长;二是数据源的范围不断扩大;三是数据容量、多样性、工作负载的并发性不断增长;四是对实时性、低延迟的需求快速上升到新的高度。

图形分析将推动大数据的规模和复杂度进化到下一个高度。Hadoop是这一进化过程的重要组成部分,但它不一定是核心。将全部数据存储的在内存中的大规模并行图形数据库架构将推动这一进程,还有NoSQL数据库,它们专注于发现、关联和预处理所有来源的行为数据。

如果你对图形分析产生了浓厚的兴趣,就需要熟悉大数据的3V特征,即容量、速度和多样性。随着硬件成本的不断降低和对数据计算架构的把握,在不久的将来,将有很多组织机构开始运作全球范围的图形分析云,这些分析云将在内存中零延迟的处理EB级的数据。


原文发布时间为:2013-08-18


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号


相关实践学习
简单用户画像分析
本场景主要介绍基于海量日志数据进行简单用户画像分析为背景,如何通过使用DataWorks完成数据采集 、加工数据、配置数据质量监控和数据可视化展现等任务。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
21天前
|
存储 消息中间件 监控
【Flume】Flume在大数据分析领域的应用
【4月更文挑战第4天】【Flume】Flume在大数据分析领域的应用
|
1月前
|
Cloud Native 数据处理 云计算
探索云原生技术在大数据分析中的应用
随着云计算技术的不断发展,云原生架构作为一种全新的软件开发和部署模式,正逐渐引起企业的广泛关注。本文将探讨云原生技术在大数据分析领域的应用,介绍其优势与挑战,并探讨如何利用云原生技术提升大数据分析的效率和可靠性。
|
1月前
|
存储 消息中间件 大数据
Go语言在大数据处理中的实际应用与案例分析
【2月更文挑战第22天】本文深入探讨了Go语言在大数据处理中的实际应用,通过案例分析展示了Go语言在处理大数据时的优势和实践效果。文章首先介绍了大数据处理的挑战与需求,然后详细分析了Go语言在大数据处理中的适用性和核心技术,最后通过具体案例展示了Go语言在大数据处理中的实际应用。
|
1月前
|
数据采集 运维 数据挖掘
API电商接口大数据分析与数据挖掘 (商品详情店铺)
API接口、数据分析以及数据挖掘在商品详情和店铺相关的应用中,各自扮演着重要的角色。以下是关于它们各自的功能以及如何在商品详情和店铺分析中协同工作的简要说明。
|
3月前
|
关系型数据库 MySQL Serverless
高顿教育:大数据抽数分析业务引入polardb mysql serverless
高顿教育通过使用polardb serverless形态进行数据汇总,然后统一进行数据同步到数仓,业务有明显高低峰期,灵活的弹性伸缩能力,大大降低了客户使用成本。
|
3月前
|
机器学习/深度学习 数据采集 算法
大数据分析技术与方法探究
在当今信息化时代,数据量的增长速度远快于人类的处理能力。因此,如何高效地利用大数据,成为了企业和机构关注的焦点。本文将从大数据分析的技术和方法两个方面进行探究,为各行业提供更好的数据应用方向。
|
3月前
|
机器学习/深度学习 人工智能 自然语言处理
大数据分析的技术和方法:从深度学习到机器学习
大数据时代的到来,让数据分析成为了企业和组织中不可或缺的一环。如何高效地处理庞大的数据集并且从中发现潜在的价值是每个数据分析师都需要掌握的技能。本文将介绍大数据分析的技术和方法,包括深度学习、机器学习、数据挖掘等方面的应用,以及如何通过这些技术和方法来解决实际问题。
53 2
|
3月前
|
机器学习/深度学习 人工智能 运维
大数据分析:探索信息世界的钥匙
在当今信息爆炸的时代,大数据分析成为挖掘宝藏般的技术和方法。本文将介绍大数据分析的基本概念、技术与方法,并探讨其在商业、科学和社会领域中的广泛应用。从数据收集和预处理到模型构建和结果解读,大数据分析为我们揭示了信息世界的钥匙,为决策者提供了有力的支持。
|
2月前
|
API
GEE案例分析——利用sentinel-3数据计算空气污染指数(Air Pollution Index,简称API)
GEE案例分析——利用sentinel-3数据计算空气污染指数(Air Pollution Index,简称API)
109 0
|
3月前
|
数据挖掘
离线大数据分析的应用
离线大数据分析的应用

热门文章

最新文章