物理学博士教你怎样分析微博数据,怎样涨粉-阿里云开发者社区

开发者社区> 小旋风柴进> 正文

物理学博士教你怎样分析微博数据,怎样涨粉

简介:
+关注继续查看

0

网上已经有太多关于怎么增加微博粉丝数,以及怎样让我们发的微博获得更多转发的建议了。我们并不知道这些建议是否有效,因为它们大都是建立在个人感觉上,而缺乏真正有说服力的证据。实际上微博是一个非常适合进行数据分析的东西,所以想谈微博心得,你得用数据说话。


一个普通用户的微博数据

从 2012 年 8 月 24 日开始,我像个自恋者一样,每天都看看自己的粉丝数涨了多少——不但看,而且还顺手把数字记录下来。这样坚持到写作本文的时候一共过去了 86 天。这个数据的可贵之处并不在于它是人工测量的,而在于它是独一无二的:由于不管是新浪微博还是 Twitter 都不记录,或者至少是不提供“关注”这个动作的发生时间。现有的任何微博相关数据研究也都没有精确的粉丝数随时间变化记录。如果能得到更多像这样的数据,我们完全可以写一篇像本文后面要介绍的那两篇一样重要的论文。

下面这张图就是我在这86天中粉丝的增长情况。上图是总的粉丝数,下图是每天增加的粉丝数。

0

我曾经设想,一个人粉丝的增加应该是指数增长的:关注你的人越多,你的影响力就越大,那么就会使得有更多人来关注你。这样的微分方程是 df/dt = cf,所以 f = ect 。然而实际上的增长却大致是线性的,df/dt=常数!除了几次突然爆发之外,我大概每天增加 10 个粉丝。图中用数字标记了 4 个突然增长事件,其中 9 月 15 日 和 10 月 22 日这两次比较大。不算突发事件,我的增长速度相当稳定:图中两段近似直线中,第一段平均每天增加粉丝 9.2 个,第二段平均每天 10.5 个,这还包括了(2)和(3)两次小跳跃。如果真有指数增长,那么或者发生在账户开通的初期,或者要等到账户已经相当有知名度之后,或者本身是个极大尺度的现象难以在这么短的时间内表现。


所以如果你认为增加粉丝的最好办法是多发好的微博,结果可能会让你失望。事实是只有出现爆发事件才能让你的粉丝数上个台阶 。在图中标记的四个爆发事件中:


(1)是我在果壳网发表了 近亲不如远邻:最关键的人脉是不熟的朋友 。我 9 月 15 日的相关微博被转发超过一千次,而更重要的是 @果壳网(粉丝 60 万)在微博对此文进行了介绍,结果是一天之内增长了 300 多个粉丝。


(2)这个小波动发生在 9 月 23 日,而我从 9 月 16 日到 24 日间一条微博都没发过。我不知道这是什么原因,很可能是(1)的一个余波。


(3)是我在博客发了《一个关于转世的流行病学研究》一文。从粉丝的增长情况来看这篇文章的影响力不大。此后在《上海书评》发表《四万年来谁著史》,仍然没有带来多少粉丝。


(4)是 @cnsns (粉丝3万多)在微博对我进行了 推荐 ,而这条推荐又被 @经纬张颖 (粉丝342万)转发,导致粉丝数在 33 分钟内增加了 321 个,两天增加了 800 多。


我在三个月内发了大概上百条微博。发微博对当天增加粉丝有一定的影响,但是在绝大多数情况下不会带来什么爆发。由此可见增加微博粉丝数的最好办根本不是发微博,发微博还不如少发几条微博写篇正经文章。当然最有效的办法也不是写文章,而是被大V推荐。这里没有记录到的是在我微博账号建立的初期也曾有过一次爆发,是媒体人土摩托(粉丝14万)和松鼠科学会成员等科学作者的推荐导致。


来自名人的大数据

没有多少人会像我一样每天记录自己的粉丝数,这使得大规模研究微博账户的成长过程非常困难。但是卡耐基梅隆大学和微软的研究人员仍然 想了一个没有办法的办法 。Twitter跟新浪微博一样,虽然不记录每个“关注动作”的发生时间,但它把你所有的粉丝按照关注你的先后顺序排列。同时,Twitter还提供每个账号的首次注册时间。这样对其中任何一个粉丝,研究人员找到他的注册时间,并且找到在他之前关注你的所有粉丝的注册时间,然后把所有这些时间中最晚的那个,就当成他这次关注发生的时间。可以想象这是一个非常不精确的估计,但只要数据量足够大,仍然是可以接受的。


这篇文章发现, 哪怕对于具有相当量级的名人来说 ,“被推荐”仍然是最重要的增长粉丝办法。下面这张图表现了技术博客 Anil Dash,娱乐界女星 Kim Kardashian 和纽约时报的 Twitter 账户被关注的时间曲线。他们粉丝的增长充满了突变,而其中最大的几次突变,正是因为 Twitter 对他们进行了系统推荐。

0

图中事件(1)是 Twitter 引入了一个系统推荐名单,而纽约时报在这张名单上。我们看到这个名单一出来,纽约时报每天增加的粉丝数立即提升了一个层次。到 2009 年 4 月,Kardashian也被加入到这份名单之中,于是她的粉丝数也开始暴涨。没进推荐名单之前,Dash的粉丝数每天增加 50 个,等到十月份被加进推荐名单之后,他的粉丝数每天增加 2500 个!一个有意思的现象是 Dash 进来之后纽约时报和 Kardashian 的成长开始放缓,研究者也不确定这是怎么回事。根据后面的变化推断,对纽约时报来说,很可能是因为 Twitter 在十月份扩大了推荐名单上的人数,使得它的重要性被稀释。而对 Kardashian 来说,则可能是她被从推荐名单上移除了。


事件(2)是 Twitter 改变了推荐方式,把推荐账户分类,让用户自己根据兴趣选择。这个变化对 Dash 和纽约时报带来了一个打击,二者每天增加粉丝数都显著减少。但 Kardashian 因为早已不在推荐名单上,她的成长没有受到影响,仍然逐步增加,甚至有点指数增长的意思。


事件(3)是 Twitter 再次改变推荐方式,变成根据每个用户的兴趣来定制推荐。这一次纽约时报和 Kardashian 都受益了,而 Dash 受到的影响不大,仍然每天增加200左右的粉丝。


仅从这张图而论,系统推荐的作用实在是太大了。技术博客 Dash 和纽约时报的粉丝层长几乎完全由系统决定,只有像 Kardashian 这样的女明星才能跑出一段不顾大盘的强势增长—— 据说 请她发一条广告微博的价格是一万美元。那这些明星们的增长靠的又是什么?得看下面这张图:

0

像 Oprah Winfrey 这样的大佬一在 Twitter 现身(事件1),马上就有了众多粉丝,但是最初的高潮之后加粉的速度却越来越放缓,变成跟 Ashton Kutcher 差不多的趋势。真正能做到加粉速度越来越快,好像指数增长一样的是 Lady Gaga 和 Justin Bieber 这样的偶像派!他们的粉丝是怎么来的?是因为他们发了高质量微博吗?当然不是。


这两人的粉丝成长,是他们在现实生活中事业成长的反应 。Justin Bieber 在2009年初还是个无名之辈,Lady Gaga 2010 年后才大红大紫。我们看 Lady Gaga 的几个关键事件,(2)是她得了 MTV 的音乐奖,(3)是她参演了艾美奖,(4)是她出了新MV“Telephone”。图中事件(5)很有意思,是明星 Soulja Boy 突然删除自己原有的Twitter账号又建了个新的,粉丝们忙着关注他的新账号,一时之间产生了大量的关注动作,以至于我们图上这几位明星的 relative popularity 都被抢了风头。


这样看来非常明显,哪怕是对名人而言,也是系统推荐的力量最强,其次则是看你在现实世界干了什么。明星们微博粉丝的变化很可能与他们发什么微博关系不大。在新浪微博姚晨的粉丝最多(现在已经是谢娜了),但姚晨却未必是中国最火的女明星,据此可以推测是新浪的推荐帮了大忙。


而对于我们普通人来说,既没机会被系统看上,也没机会在真实世界兴风作浪,想要涨粉丝也许只能靠发几条有意思的微博。我们期待这些微博能被广泛转发,因为只有这样才能被更多人看到,引来新粉丝。但是怎样获得更多转发?更重要的是,转发真有用么?


什么样的微博转发量惊人

Palo Alto Research Center 的几位研究者 专门研究 了Twitter上的转发。一条微博被转发的平均次数应该跟两个因素有关:微博本身的内容,以及发帖者的粉丝数。粉丝数容易测量,可是微博内容好坏很难测量,这项研究只能采用最简单的办法。


一个办法是看微博中是否包含网址链接(URL)。包含 URL 的微博至少言之有物,总比发条在哪吃饭的状态有可读性。这个研究总共统计了 7400 万条微博(对 Twitter 来说这叫 tweets),统计发现全部其中 21.1% 包含 URL,而那些纯转发的微博中则有 28.4% 含URL。这个结果似乎不怎么明显,但此文引用的另一项研究的两个数字则分别是 18.96% 和 56.69%。不论如何,介绍一个从别处看到的信息的确能够增加微博的转发几率。


获得更多转发的另一个办法是参与话题,也就我们经常看到的两个“#”,这样别人只要点击这段话就能找到所有写了这段话的微博。统计表明全部 tweet 中的 10.1% 含有话题,而那些转发的tweet含话题的比例则是 20.8%。


这两个数据都平淡无奇,完全符合我们的预期。我们真正想发的是那种一出来就被迅速广为传播,乃至一层一层传出去引发爆炸式增长的微博。但正如我以前曾经在 别用“常识”理解复杂世界 中介绍过的那样,引发这种“twitter瀑布”具有极大的偶然性,就算是粉丝众多的人也未必能经常做到。


这项研究并没有明确指出,但是据我观察更为关键的一个事实是,偶尔发几条被广为转发的微博并不能给你显著增加多少粉丝。@Yaoyao521 今年四月发了一条关于出租车司机不收盲人车费的 微博 ,这条微博讲了一个很好的正能量故事,被转发次数超过一万三千,甚至还被媒体报道。作者目前为止一共发过五千多条微博,可是她的粉丝仍然只有 3608 个。像这样的例子并不罕见,很多情况下并不多——而且我一次都没有因为这个原因关注他们。换句话说,除非你能持续不断地发高质量微博,证明自己是靠能力而不是运气,粉丝才会因转发而增加。


这种人有多少?肯定非常少。下面这张图是前面提到的研究统计出来的转发数跟粉丝数的关系。二者几乎就是个线性关系!一个有 5000 粉丝的人和一个有 1000 粉丝的人,微博平均被转发次数差不多也是五倍关系。这说明平均而言,粉丝多的人发的微博质量并不比粉丝少的人更高,他们仅仅因为粉丝多而获得更多转发!这个统计还表明平均每一千粉丝带来的转发数是每条微博 1.5 次,如果你的成绩比这个好,那么你属于水平比较高的。

0

有人认为多发微博可以涨粉丝,有人认为微博贵精不贵多,而这项研究告诉我们的就是你的转发几率跟你发微数量根本没关系。下图是被转发几率与发微总数的关系:

0

如图所示,不管你已经发过 500 条还是 5000 条,你下一条微博被转发的几率,平均而言,都是差不多一次。而发微频率高的人累积的条数也多,这说明 发微薄频率完全不影响被转发几率 ,因此也就不影响通过被转发而涨粉丝


结论

总而言之,逆天靠系统,名人靠事件,普通人没事件只能靠推荐,没人推荐则靠转发,而转发靠内容。以上获得粉丝手段的有效性是直线下降的,后面的远远不如前面。而最没用的,就是你的发微数量。这些性质说明我们之所以会关注某个人物,在大多数情况下是因为对这个人本身的关注,而绝不只是想看他发些什么。


本文只讨论了个人综合微博,以上所有分析未必适用于各种专业微博,比如专门搜集笑话的微博。也许只发某一方面内容的账号更容易获得粉丝,因为别人对你的内容有固定的期待。这种账号对读者来说虽然很重要,对写的人来说却未必有多大乐趣,相当于是微博世界里的NPC(非玩家控制角色)。


总而言之,想涨粉丝?功夫在微博之外。既然如此,索性别计较什么粉丝数了。也许我们写微博的真正乐趣不是为了吸引粉丝,而是图个说话痛快!


原文发布时间为:2015-04-03

本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。

相关文章
节省AI开发90%的时间,彭博让你获得直接可用的数据
与大多数人的想象不同,在机器学习领域里,处理数据所耗费的精力占据着最多比例。通常情况下,每购买 1 美元的数据,我们需要花费 5-7 美元来清理,才能让它用于机器学习模型的训练与推理。在这个过程中,数据科学家要耗费整个开发流程 80-90% 的时间。
5 0
投稿有礼 | “轻量应用服务器”征文活动全新升级
更高的奖励,更好的福利,欢迎分享你和轻量应用服务器的故事
4 0
select2,利用ajax高效查询大数据列表2(可搜索、可分页)
select2,利用ajax高效查询大数据列表(可搜索、可分页)
5 0
旷视联合智源发布全球最大物体检测数据集Objects365,举办CVPR DIW2019挑战赛
4 月 16 日,北京智源人工智能研究院(Beijing Academy of Artificial Intelligence,BAAI,2018 年 11 月 14 日成立)在北京会议中心召开了「智源学者计划暨联合实验室发布会」。
6 0
select2,利用ajax高效查询大数据列表 1(可搜索、可分页)
select2,利用ajax高效查询大数据列表(可搜索、可分页)
6 0
飞天加速计划初体验
最近因需要使用云服务器来学习,老师让我们用这个阿里云类进行相关的学习,让我们先进行免费的使用进行学习,慢慢了解,毕竟对于首次接触的事物都是了解为主不会投入大量资金。阿里云平台有详细的教程,让初学者能十分轻松的进行学习。飞天加速计划是个好想法,可以让我们这些学生进行学习,制作出自己的网站。让我在暑假对计算机有了浓厚的兴趣,于是在阿里云我选择了飞天加速计划,学习大数据和服务器啥的,让自己get到更多的知识~
6 0
OpenAI 2:0击败Dota2 TI8冠军OG(鱼腩队?),「菜鸡」小编上手体验
在 OpenAI Dota2 项目最终的决战中,OpenAI Five 2:0 战胜 Dota2 职业战队、TI 8 冠军 OG。此外,OpenAI还将在4月18-21日期间把OpenAI Five开放给玩家,注册就能体验。炫耀一下,小编现场体验了一把。
6 0
华为技术是如何领先全球的:华为云首次开放日,揭秘2012实验室
很多人都知道华为有一座「2012 实验室」,今天的华为能够成为全球通信巨头,并在技术上保持领先,2012 实验室功不可没。在这里,科研人员总能带来令人惊喜的技术成果,并很快将其加入华为的产品中。3 月 5 日,在华为云的开放日活动中,我们终于能进入这个「中国黑科技最多的地方」一探究竟了。
8 0
清华人工智能研究院成立「知识智能研究中心」,发布四大知识平台
2019 年 1 月 21 日,清华大学人工智能研究院知识智能研究中心(以下简称知识中心)成立仪式暨知识计算开放平台发布会在清华大学 FIT 楼举行。清华大学副校长、清华大学人工智能研究院管委会主任尤政院士,清华大学人工智能研究院院长张钹院士出席成立仪式并共同为中心揭牌。清华大学人工智能研究院常务副院长孙茂松教授主持成立仪式。
5 0
2728
文章
6591
问答
来源圈子
更多
+ 订阅
文章排行榜
最热
最新
相关电子书
更多
文娱运维技术
立即下载
《SaaS模式云原生数据仓库应用场景实践》
立即下载
《看见新力量:二》电子书
立即下载