Facebook数据被滥用?8个视频案例教你用好Facebook Graph API

简介:

过去的一个周末,社交网络Facebook因为用户数据被第三方API滥用帮助美国大选的事情上了热搜。直到现在,Facebook CEO小扎也没有发出任何官方回应,以及未来该如何更好的保护私人数据。有人认为作为坐拥海量用户数据的网站在获得巨大收益的同时,理应预想到数据被滥用的可能并作出防范措施,在事情发生之后也应该更积极的面对而不是回避。也有人提出犯法的是第三方API, 原罪不在Facebook。

先把这件事情放一边,可以确定的是Facebook拥有大量可供人们浏览的数据,人们可以使用此数据做很多事情。今天我们来了解一下如何使用Facebook Graph API用Python进行数据抓取和分析。

691caf800c97ce85ee6c4a7821a1f71c92252682

Facebook拥有大量数据供您探索,您可以使用以下数据做很多事情:分析Facebook页面或Facebook群组,将这些数据用于社交网络分析(SNA),为数字营销做数据分析, 甚至收集和保存自己个人项目的数据。

这些视频将向你展示如何做基本的分析,例如:

8481c8f592b7f349aa84a1de5c171db681516edf 从Facebook下载数据
8481c8f592b7f349aa84a1de5c171db681516edf 从json转换为更方便的数据结构
8481c8f592b7f349aa84a1de5c171db681516edf 处理Graph API中的日期变量和其他数据

第1课:介绍和了解Graph API

在本视频中,我将向您介绍GRAPH API,我将使用GRAPH API Explorer并向您展示一些示例请求。

b620bac3544fa373780ccc61b181c8c22d19d879

第2课:下载并保存Facebook数据

在本视频中,我将向您展示如何从Facebook页面或Facebook群组下载并保存所有数据,并记住某些要点。

b84d94afc86d26ec2ac06227fcc68a14fef29033

第3课:设置和清理数据

在第三课中,我将使用notebook来清理和审计从Facebook获得的数据,并为分析做好准备。

774150337e7db41116f5ba11e53931e7e65b7eaf

第4课:评论最多的帖子

在第四课中,我将向您展示一种简单的方式,以获得评论最多的帖子。

https://v.qq.com/x/page/s06098fb92o.html

第5课:点赞最多帖子

在这个课程中发生了一些有趣的事情,因为我发现我可以使用API访问了一些已删除的帖子。

https://v.qq.com/x/page/r0609s6vt80.html

第6课:计算词频

在这个视频中,我将向您展示如何数一个组或一个页面中的所有帖子词频。

您也可以在评论中使用相同的功能。

https://v.qq.com/x/page/j0609g7vvhp.html

第7课:按关键字对帖子进行分组

在这个视频中,我会将在页面中具有关键字“free”的帖子进行分组,并计算有多少人拥有这个关键字,以及有多少人没有这个关键字。

分组方式非常有用,我们将在未来的视频中更频繁地使用更多变量。

https://v.qq.com/x/page/f06099j7ats.html

第8课:按日期分组

在本视频中,我们将探索“创建时间”变量,以按照年份,月份或星期几对帖子进行分组。

这可以用来查找发布模式等等。

https://v.qq.com/x/page/e0609puvw9j.html



原文发布时间为:2018-03-20
本文作者:文摘菌
本文来自云栖社区合作伙伴“ 大数据文摘”,了解相关信息可以关注“ 大数据文摘”微信公众号
相关文章
|
7天前
|
安全 Java 大数据
|
7天前
|
供应链 搜索推荐 API
Commerce Cloud OCC CMS API 返回的 Product Carousel Component 数据
Commerce Cloud OCC CMS API 返回的 Product Carousel Component 数据
9 0
|
7天前
|
数据采集 机器学习/深度学习 Java
数据猎手:使用Java和Apache HttpComponents库下载Facebook图像
本文介绍了如何使用Java和Apache HttpComponents库从Facebook获取图像数据。通过设置爬虫代理IP以避免限制,利用HttpClient发送请求,解析HTML找到图像链接,然后下载并保存图片。提供的Java代码示例展示了实现过程,包括创建代理配置、线程池,以及下载图片的逻辑。注意,实际应用需根据Facebook页面结构进行调整。
数据猎手:使用Java和Apache HttpComponents库下载Facebook图像
|
7天前
|
JSON API 数据格式
淘宝商品评论数据获取:从API调用到应用实践
在电商的世界里,用户评论是洞察商品质量的一扇窗。淘宝,作为中国最大的在线购物平台,其海量的商品评论数据尤为宝贵。本文将带您走进淘宝商品评论数据的获取之旅,从API调用的基础知识到实际应用的代码示例,一探究竟。
|
7天前
|
分布式计算 DataWorks 关系型数据库
DataWorks操作报错合集之在DataWorks同步数据时,遇到乱码问题,该怎么解决(rest api数据源)
DataWorks是阿里云提供的一站式大数据开发与治理平台,支持数据集成、数据开发、数据服务、数据质量管理、数据安全管理等全流程数据处理。在使用DataWorks过程中,可能会遇到各种操作报错。以下是一些常见的报错情况及其可能的原因和解决方法。
26 0
|
7天前
|
数据采集 分布式计算 DataWorks
DataWorks产品使用合集之DataWorks数据地图中的数据发现相关api接口调用如何解决
DataWorks作为一站式的数据开发与治理平台,提供了从数据采集、清洗、开发、调度、服务化、质量监控到安全管理的全套解决方案,帮助企业构建高效、规范、安全的大数据处理体系。以下是对DataWorks产品使用合集的概述,涵盖数据处理的各个环节。
24 0
|
7天前
|
Java API 开发者
【专栏】Java 8的Stream API是处理集合数据的新方式,强调简洁和声明式编程
【4月更文挑战第27天】Java 8的Stream API是处理集合数据的新方式,强调简洁和声明式编程。它基于延迟执行和惰性求值,提供创建、中间操作(如filter、map)和终端操作(如forEach、collect)。示例展示了如何通过Stream排序、过滤、映射和聚合数据。
|
7天前
|
缓存 前端开发 JavaScript
【专栏】GraphQL,Facebook 开发的API查询语言,正在前端开发中崭露头角
【4月更文挑战第27天】GraphQL,Facebook 开发的API查询语言,正在前端开发中崭露头角。它提供强类型系统、灵活查询和实时更新,改善数据获取效率和开发体验。掌握GraphQL涉及学习基础概念、搭建开发环境和实践应用。结合前端框架,利用缓存和批量请求优化性能,与后端协作设计高效API。尽管有挑战,但GraphQL为前端开发开辟新道路,引领未来趋势。一起探索GraphQL,解锁前端无限可能!
|
7天前
|
SQL 关系型数据库 API
从API获取数据并将其插入到PostgreSQL数据库:步骤解析
使用Python处理从API获取的数据并插入到PostgreSQL数据库:安装`psycopg2`,建立数据库连接,确保DataFrame与表结构匹配,然后使用`to_sql`方法将数据插入到已存在的表中。注意数据准备、权限设置、性能优化和安全处理。
|
7天前
|
JSON JavaScript API
访问REST API:在Vue中消费和管理远程数据
【4月更文挑战第23天】本文探讨了在Vue应用中高效访问REST API的方法,包括选择合适的API、使用Axios或Fetch发送请求、封装API服务、处理响应和数据、错误管理及性能优化。关键点在于创建服务层封装请求,使用计算属性和方法处理数据,以及实施错误处理和性能提升策略。通过这些最佳实践,开发者能更好地管理和消费远程数据,构建出动态、响应式的Vue应用。

热门文章

最新文章