《数据科学:R语言实现》——2.8 获取Facebook数据

简介:

本节书摘来自华章出版社《数据科学:R语言实现》一 书中的第2章,第2.8节,作者:R for Data Science Cookbook 丘祐玮(David Chiu),更多章节内容可以访问云栖社区“华章计算机”公众号查看。

2.8 获取Facebook数据

社交网络数据对于发掘和分析社会交互的用户来说,是另一个很好的数据源。社交网络数据与网站数据的主要不同是,社交网络通常提供了半结构化的数据格式(大部分是JSON)。因此,我们可以轻松地访问到数据,而不需要关注数据是如何结构化的。在本教程中,我们会介绍如何使用rvest和rson来读取和解析Facebook的数据。
准备工作
在本教程中,你需要给开发环境安装R,同时确保计算机可以访问互联网。
实现步骤
执行下列步骤,访问Facebook数据。
1.首先,我们需要登入Facebook,访问开发者页面(https://developers.facebook.com/),如图18所示。
screenshot

3.然后,单击Get Token,选择Get Access Token,如图20所示。

screenshot

4.在User Data Permissions面板中,选择user_tagged_places,并单击Get Access Token,如图21所示。

screenshot

5.复制生成的请求令牌到剪贴板,如图22所示。

screenshot

6.尝试使用rvest访问Facebook API:
screenshot

运行原理
在本教程中,我们介绍了如何通过Facebook的图形API获取社交网络数据。与网页爬取不同,在发出任何内部数据请求之前,你需要获取Facebook的访问令牌。有两种获取访问令牌的方式:一个是使用Facebook的图形API探索器,另一个是创建Facebook应用。在本教程中,我们介绍了如何使用Facebook的图形API探索器获取访问令牌。
Facebook的图形API探索器可以代替用户创建请求URL访问Facebook数据。为了访问探索器页面,我们首先访问Facebook的开发者页面(https://developers.facebook.com/ )。图形API探索器页面位于Tools & Support的下拉菜单中。来到探索器页面后,我们从Get Token的下拉菜单中选取Get Access Token。然后,会出现一个表格窗口,你可以查看有关应用的各个级别的访问许可。例如,我们可以查看tagged_places来访问之前标记的位置。选好所需的许可后,我们可以单击Get Access Token运行图形API探索器访问我们的内部数据。完成这些步骤之后,你可以看到一个访问令牌,它是一个临时的、短期有效的、允许访问Facebook API的令牌。
借助访问令牌,我们可以使用R访问Facebook API。首先,我们需要一个HTTP请求程序包。类似于网页爬取教程,我们使用rvest程序包生成请求。我们创建一个请求URL,同时带有Facebook API的access_token(从图形API探索器复制得到)。我们应该从响应输出获取到JSON格式化的数据。要读取JSON格式化数据的属性,我们安装加载了RJSON程序包。我们可以使用函数fromJSON读取来自响应的JSON格式字符串。
最后,我们使用函数sapply读取地点和ID信息,然后我们使用数据框转换抽取的信息。在教程结尾,我们应该可以看到数据框格式的数据。
更多技能
要更多了解图形API,可以阅读下列Facebook官方文档:https://developers.facebook.com/docs/reference/api/field_expansion/
1.首先,我们需要安装加载Rfacebook程序包:

2.然后,我们通过提供的访问令牌,使用内置函数获取用户数据或者访问类似的信息:

如果你不希望每次都登入Facebook,就可以爬取公开粉丝网页,你可以创建一个Facebook应用来访问内部数据。
1.要创建一个授权的应用令牌,登入Facebook开发者页面,单击Add a New App,如图23所示。

screenshot

2.你可以创建一个新的Facebook应用,只要没有被注册过即可,可以带有名称和合法的e-mail ID,如图24所示。
3.然后,你可以复制应用ID和密钥,并创建访问令牌给|,如图25所示。现在你可以使用这个令牌,通过图形API爬取公开粉丝页面信息了:
4.与Rfacebook类似,我们可以把access_token替换成|:
screenshot

相关文章
|
1天前
【视频】什么是非线性模型与R语言多项式回归、局部平滑样条、 广义相加GAM分析工资数据|数据分享(下)
【视频】什么是非线性模型与R语言多项式回归、局部平滑样条、 广义相加GAM分析工资数据|数据分享
|
1天前
|
数据可视化 数据挖掘
【视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享
【视频】复杂网络分析CNA简介与R语言对婚礼数据聚类社区检测和可视化|数据分享
|
1天前
|
测试技术
数据分享|R语言回归,虚拟变量和交互项,假设检验:F检验、AIC和 BIC分析学生成绩数据附自测题(下)
数据分享|R语言回归,虚拟变量和交互项,假设检验:F检验、AIC和 BIC分析学生成绩数据附自测题
|
1天前
|
机器学习/深度学习 数据可视化
数据分享|R语言回归,虚拟变量和交互项,假设检验:F检验、AIC和 BIC分析学生成绩数据附自测题(上)
R语言随机森林RandomForest、逻辑回归Logisitc预测心脏病数据和可视化分析
|
1天前
|
机器学习/深度学习 自然语言处理 算法
【视频】K近邻KNN算法原理与R语言结合新冠疫情对股票价格预测|数据分享(下)
【视频】K近邻KNN算法原理与R语言结合新冠疫情对股票价格预测|数据分享
|
1天前
|
机器学习/深度学习 算法 大数据
【视频】K近邻KNN算法原理与R语言结合新冠疫情对股票价格预测|数据分享(上)
【视频】K近邻KNN算法原理与R语言结合新冠疫情对股票价格预测|数据分享
|
1天前
|
机器学习/深度学习 数据可视化 数据挖掘
数据分享|R语言主成分PCA、因子分析、聚类对地区经济研究分析重庆市经济指标
数据分享|R语言主成分PCA、因子分析、聚类对地区经济研究分析重庆市经济指标
|
3天前
|
vr&ar Python
R语言风险价值:ARIMA,GARCH,Delta-normal法滚动估计VaR(Value at Risk)和回测分析股票数据
R语言风险价值:ARIMA,GARCH,Delta-normal法滚动估计VaR(Value at Risk)和回测分析股票数据
|
1天前
|
机器学习/深度学习 算法 数据挖掘
R语言在金融分析中的应用
【4月更文挑战第25天】R语言在金融分析中扮演关键角色,尤其在风险管理、资产定价、量化交易、市场预测和投资组合优化方面。作为开源的统计计算和图形平台,R语言拥有强大的统计功能、丰富的包支持和交互式环境。在风险管理中,R用于评估和管理风险,如VaR和ES;在资产定价上,它支持经典模型和衍生品定价;在量化交易领域,R提供策略开发和回测工具;市场预测利用R的统计和机器学习功能;而在投资组合优化上,R帮助确定最佳资产配置。随着金融技术发展,R语言的应用将持续增长。
|
1天前
|
数据挖掘 C++
使用R语言进行时间序列分析
【4月更文挑战第25天】时间序列分析是一种重要的数据分析方法,广泛应用于经济学、金融学、气象学、生态学等领域。R语言是一种强大的统计分析工具,提供了丰富的函数和包用于时间序列分析。本文将介绍使用R语言进行时间序列分析的基本概念、方法和实例,帮助读者掌握R语言在时间序列分析中的应用。

热门文章

最新文章