过去的一个周末,社交网络Facebook因为用户数据被第三方API滥用帮助美国大选的事情上了热搜。直到现在,Facebook CEO小扎也没有发出任何官方回应,以及未来该如何更好的保护私人数据。有人认为作为坐拥海量用户数据的网站在获得巨大收益的同时,理应预想到数据被滥用的可能并作出防范措施,在事情发生之后也应该更积极的面对而不是回避。也有人提出犯法的是第三方API, 原罪不在Facebook。
先把这件事情放一边,可以确定的是Facebook拥有大量可供人们浏览的数据,人们可以使用此数据做很多事情。今天我们来了解一下如何使用Facebook Graph API用Python进行数据抓取和分析。
![691caf800c97ce85ee6c4a7821a1f71c92252682](https://yqfile.alicdn.com/691caf800c97ce85ee6c4a7821a1f71c92252682.png?x-oss-process=image/resize,w_1400/format,webp)
Facebook拥有大量数据供您探索,您可以使用以下数据做很多事情:分析Facebook页面或Facebook群组,将这些数据用于社交网络分析(SNA),为数字营销做数据分析, 甚至收集和保存自己个人项目的数据。
这些视频将向你展示如何做基本的分析,例如:
![8481c8f592b7f349aa84a1de5c171db681516edf](https://yqfile.alicdn.com/8481c8f592b7f349aa84a1de5c171db681516edf.png?x-oss-process=image/resize,w_1400/format,webp)
![8481c8f592b7f349aa84a1de5c171db681516edf](https://yqfile.alicdn.com/8481c8f592b7f349aa84a1de5c171db681516edf.png?x-oss-process=image/resize,w_1400/format,webp)
![8481c8f592b7f349aa84a1de5c171db681516edf](https://yqfile.alicdn.com/8481c8f592b7f349aa84a1de5c171db681516edf.png?x-oss-process=image/resize,w_1400/format,webp)
第1课:介绍和了解Graph API
在本视频中,我将向您介绍GRAPH API,我将使用GRAPH API Explorer并向您展示一些示例请求。
![b620bac3544fa373780ccc61b181c8c22d19d879](https://yqfile.alicdn.com/b620bac3544fa373780ccc61b181c8c22d19d879.png?x-oss-process=image/resize,w_1400/format,webp)
第2课:下载并保存Facebook数据
在本视频中,我将向您展示如何从Facebook页面或Facebook群组下载并保存所有数据,并记住某些要点。
![b84d94afc86d26ec2ac06227fcc68a14fef29033](https://yqfile.alicdn.com/b84d94afc86d26ec2ac06227fcc68a14fef29033.png?x-oss-process=image/resize,w_1400/format,webp)
第3课:设置和清理数据
在第三课中,我将使用notebook来清理和审计从Facebook获得的数据,并为分析做好准备。
![774150337e7db41116f5ba11e53931e7e65b7eaf](https://yqfile.alicdn.com/774150337e7db41116f5ba11e53931e7e65b7eaf.png?x-oss-process=image/resize,w_1400/format,webp)
第4课:评论最多的帖子
在第四课中,我将向您展示一种简单的方式,以获得评论最多的帖子。
https://v.qq.com/x/page/s06098fb92o.html
第5课:点赞最多帖子
在这个课程中发生了一些有趣的事情,因为我发现我可以使用API访问了一些已删除的帖子。
https://v.qq.com/x/page/r0609s6vt80.html
第6课:计算词频
在这个视频中,我将向您展示如何数一个组或一个页面中的所有帖子词频。
您也可以在评论中使用相同的功能。
https://v.qq.com/x/page/j0609g7vvhp.html
第7课:按关键字对帖子进行分组
在这个视频中,我会将在页面中具有关键字“free”的帖子进行分组,并计算有多少人拥有这个关键字,以及有多少人没有这个关键字。
分组方式非常有用,我们将在未来的视频中更频繁地使用更多变量。
https://v.qq.com/x/page/f06099j7ats.html
第8课:按日期分组
在本视频中,我们将探索“创建时间”变量,以按照年份,月份或星期几对帖子进行分组。
这可以用来查找发布模式等等。
https://v.qq.com/x/page/e0609puvw9j.html