Python 爬取吴亦凡的 10 万转发数据,扒一扒流量的真假!

简介: Python 爬取吴亦凡的 10 万转发数据,扒一扒流量的真假!

由于时间点也挺凑巧,刚好赶在蔡徐坤发律师函给哔哩哔哩之后,不禁让大家对他们进行一番对比。同为我们印象中的流量明星,吴亦凡跟蔡徐坤之间有什么不一样吗?大伙儿是怎么看待他们的?又是怎么看待《大碗宽面》这首歌的呢?

我们通过微博移动端随机抓取了吴亦凡发布新歌《大碗宽面》的微博转发数据10万条(时间节点2019年4月20日01时)。该微博于2019年4月19日10时发布,到4月20日01时已被转发超过36万。

1240

吴亦凡该微博的转发是否存在假流量?

当然,关注我的朋友们估计最关心的问题是,吴亦凡的微博转发是否像蔡徐坤一样,有很多都是假流量?

我们先从粉丝性别比例入手。我们统计了102118条转发数据中,有77279条是女性转发的,占75.7%,其余24839条是男性转发的,占24.3%。这是一个比较合理的比例。

1240

我们随机抽取了男性的转发,发现这里的男粉丝几乎都是有简介、微博粉丝数、关注数都大于50的真粉丝。

1240

咦,不是说吴亦凡是流量明星吗?难道很多假流量都存在于女性的转发里?我们又随机抽取了女性转发的数据,发现,这里面的女性粉丝几乎也都是有简介、微博粉丝数、关注数都大于50的真粉丝。

1240

我们就更奇怪了:吴亦凡的假流量哪儿去了?

我们按照跟蔡徐坤一样的标准,把转发数据中转发者的关注或者粉丝数少于等于5、没有简介、转发之后被点赞数评论数再转发数都为0、微博会员等级为0级的数据(注意,这里的条件都是“且”的关系,而不是“或”,也就是需要满足所有条件才会被判定是假粉丝),以及转发者的关注或者粉丝数大于等于5但昵称长“用户XXXXXXXX”这样的数据抽取了出来。看看吴亦凡的真假流量各是多少。

1240

可见,吴亦凡的《大碗宽面》微博102118条转发中,只有6100条是疑似假粉丝转发的,占6%,有94%都是真粉丝转发的。这跟蔡徐坤的转发数据截然相反。

1240

96018条真粉丝转发的数据中,除去重复转发刷榜的数量,里面还有81872个真粉丝。也就是说,真实转发的粉丝数量,占总转发量的80.2%。这比蔡徐坤3.84%的真实转发粉丝数量高出了一大截。也说明至少在这首歌上,吴亦凡的假流量占比是很少的。这首歌能火起来,靠的是大家对这首歌的接受度。


大家对于《大碗宽面》怎么看?

既然这样,那大家是以一种什么样的态度看待这首歌的呢?我们利用SnowNLP这个中文文本挖掘库对转发中所带的每一条评论进行情感倾向分析并打分(分值为0-1,越接近0情感越负面,越接近1情感越正面,0.5为中立)。

1240

所有转发所带的评论,对《大碗宽面》的平均情感倾向评分是0.686。也就是大家整体对于这首歌的评论都是偏正面的,这跟这首歌的豆瓣评分6.5分(10分制)也相差不远。

1240

随机抽取出情感倾向高的评论,大家都认为吴亦凡可以自嘲自黑很酷、很接底气、很可爱,认为吴亦凡可以通过这种方式来破网友对自己的吐槽梗,心胸很开阔。跟律师函警告相比之下,不知道高出了多少。

1240

有多少人拿吴亦凡与蔡徐坤作对比?

由于这首歌发布的时间比较凑巧,刚好在蔡徐坤发律师函给哔哩哔哩并引起网友一阵吐槽之后,所以大家难免会把吴亦凡和蔡徐坤放在一起比较。那么,拿他们两个一起比较的人多吗?

我们把评论中带有跟蔡徐坤有关字眼(比如包含“kun”、“坤”、“律师函”等)的评论都抽了出来,发现足足有6229条,也就是大概15条评论中,就有一条把他们两个放在一起比较的。

抽取其中点赞数最高的10条,看看大家都怎么进行比较的。

1240

大伙儿都对吴亦凡的公关团队表示佩服,可以把槽点转变为亮点,有很多人佩服吴亦凡的气度和格局,还有很多人认为这和律师函相比,高下立判。

有多少人开始路转粉了?

既然这首歌风评那么好,是不是很多人开始路转粉了呢?我们把带有“转粉”、“圈粉”等字眼的评论抽取了出来,发现这里面有足足3646条评论是关于转粉的。

1240

而这3646条评论中,有2441条是女性的评论,还有1205条是男性的评论,占1/3!按照比例保守估计,目前37万的转发中,吴亦凡已成功圈粉13000人!并且使很多原来不喜欢他的黑粉,开始转变为路人。

1240

评论的词云图

按照惯例,我们把转发中所带的评论制作成了词云图。

1240

如果你在学习Python的过程当中有遇见任何问题,多多交流问题,互帮互助,群里有不错的学习教程和开发工具。学习python有任何问题(学习方法,学习效率,如何就业),可以随时来咨询我




可以看到:

1. 正如微博配词所说“大碗宽面能让你开心,这确是我本意”,大家对于这首自嘲歌的最大反应是“哈哈哈”;

2. 大家觉得这首歌很好听、有趣、有意思,觉得吴亦凡很可爱;

3. 有人第一次对吴亦凡说了“对不起”,对吴亦凡开始有Respect,开始路转粉;

4. 还有人拿蔡徐坤出来比较,拿律师函出来调侃。

看来,在娱乐圈里生存,开阔的心胸和善于自嘲的态度是很必要的。眼看着吴亦凡被万千吐槽,今天还能收获掌声一片,从一开始的流量明星转变为一个具有真流量的谐星。

所以说,千万别虚荣心作祟,娱乐圈嘛,快乐才是真谛,何必针锋相对。有时候不缺硬刚的勇气,缺的是娱乐的智慧。人生如戏开个玩笑,听完歌就洗洗睡。

相关文章
|
6天前
|
数据采集 存储 架构师
上进计划 | Python爬虫经典实战项目——电商数据爬取!
在如今这个网购风云从不间歇的时代,购物狂欢持续不断,一年一度的“6.18年中大促”、“11.11购物节”等等成为了网购电商平台的盛宴。在买买买的同时,“如何省钱?”成为了大家最关心的问题。 比价、返利、优惠券都是消费者在网购时的刚需,但在这些“优惠”背后已产生灰色地带。
|
7天前
|
数据采集 数据挖掘 API
主流电商平台数据采集API接口|【Python爬虫+数据分析】采集电商平台数据信息采集
随着电商平台的兴起,越来越多的人开始在网上购物。而对于电商平台来说,商品信息、价格、评论等数据是非常重要的。因此,抓取电商平台的商品信息、价格、评论等数据成为了一项非常有价值的工作。本文将介绍如何使用Python编写爬虫程序,抓取电商平台的商品信息、价格、评论等数据。 当然,如果是电商企业,跨境电商企业,ERP系统搭建,我们经常需要采集的平台多,数据量大,要求数据稳定供应,有并发需求,那就需要通过接入电商API数据采集接口,封装好的数据采集接口更方便稳定高效数据采集。
|
19天前
|
数据采集 Python
在Python中进行数据清洗和预处理缺失值处理缺失数据剔除
在Python中进行数据清洗和预处理缺失值处理缺失数据剔除
27 4
|
4天前
|
数据挖掘 数据处理 Python
使用Python自动化处理Excel数据
【2月更文挑战第4天】在现代社会,数据处理已经成为了一项重要的任务。而Excel作为一款广泛应用于数据处理的软件,已经成为了许多人的首选。不过,对于大规模的数据处理任务,手动进行Excel操作可能是低效的。本文将介绍如何使用Python编程语言来自动化处理Excel数据。
21 9
|
4天前
|
数据可视化 数据挖掘 Python
Python中的数据可视化工具Matplotlib详解
本文将深入探讨Python中广泛应用的数据可视化工具Matplotlib,介绍其基本概念、常用功能和实际应用,帮助读者更好地利用Matplotlib进行数据可视化,提升技术水平。
|
6天前
|
数据采集 前端开发 JavaScript
Python爬虫之Ajax数据爬取基本原理#6
Ajax数据爬取原理【2月更文挑战第19天】
15 1
Python爬虫之Ajax数据爬取基本原理#6
|
6天前
|
存储 数据挖掘 数据处理
Python与Excel的交互:读写Excel文件和处理数据
Python与Excel的交互:读写Excel文件和处理数据
|
6天前
|
存储 Python
Python提取出多个NC文件中的时间信息数据
【2月更文挑战第2天】本文介绍基于Python语言,逐一读取大量.nc格式的多时相栅格文件,导出其中所具有的全部时间信息的方法~
Python提取出多个NC文件中的时间信息数据
|
6天前
|
数据采集 XML 数据处理
Python爬虫实战:利用BeautifulSoup解析网页数据
本文将介绍如何利用Python中的BeautifulSoup库来解析网页数据,帮助读者更好地开发爬虫程序,实现自动化数据采集与处理。
|
9天前
|
数据采集 人工智能 数据挖掘
Python数据分析:利用Pandas库处理缺失数据的技巧
在数据分析中,数据的完整性对结果的准确性至关重要。本文将介绍如何利用Python中强大的Pandas库来处理数据中的缺失值,帮助您更好地进行数据清洗和分析。

相关产品

  • 云迁移中心