微博关注者数量在计算中的作用

简介:

郑昀 20101011

    一个微博用户的关注者数量(在Twitter中称为Followers),有几种用途:

一、对于Google来说,由于一个用户关注另一个用户,相当于一个页面指向另一个页面,所以PageRank的算法大致可照搬。

    "One user following another in social media is analogous to one page linking to another on the Web. Both are a form of recommendation," Singhal tells Technology Review. "As high-quality pages link to another page on the Web, the quality of the linked-to page goes up. Likewise, in social media, as established users follow another user, the quality of the followed user goes up as well."

    当决定哪一条微博消息(Tweet)要显示在搜索结果中前列时,Google不单单关注followers的数量,还关注这些followers的价值。

 

二、在热门消息榜类型的应用里,却要反其道而行之,要削减followers多的用户权重。

    对于微博客来说,如果要做一个热门消息实时榜单,有一个问题绕不过去,那就是对人气特别旺的帐号如何处理?在做Twitter锐推榜时,很多人提出这个问题,能不能让那些followers数量巨大的人少上榜,更有人建议让上榜阈值与该用户的followers数挂钩,比如成反比,followers越多,上榜越困难。

    由于followers数与微博消息的价值之间没有明确的关联,所以不适合简单粗暴地成反比。

    在针对国内微博网站,如新浪微博,制作热门转发消息实时榜单(t.rtmeme.com)时,我采用如下简单的规则,来减少名人上榜几率。

 

加入关注者数量的考量

    一条消息是否能够上榜,当然取决于它的转发数和评论数,但是名人关注者多(粉丝多),理所当然地有更大几率被转发,然而名人的消息未必有什么价值。t.rtmeme.com虽然一直在阻止明星推上榜,但名人或者说人气比较旺的用户,却很难遏制。

    所以需要在t.rtmeme.com上榜公式中引入关注者数量这个参数。

    一般来说,在新浪微博中,1K个关注者意味着转发数可能是个位数的,10K个关注者时转发数可能平均达到两位数,所以可以近似一个转发比率1:1K。

    那么一个关注者数为88万的名人@冯小刚 ,他的转发因子是880(即期望平均转发数是880次);此时,如果他有一条消息被转发了1000次,那么1000/880=1.14,这个数字代表转发数是否超过预期。

    下面再多举些例子:

关注者数为31352的@作业本 ,转发因子是31;他的某消息转发数是544,那么544/31=17.5,就说明该消息价值明显优于冯小刚的那条。

关注者数为1,894,927的@李开复 ,转发因子是1894;某消息转发数是5351,那么5351/1984=2.69,也还在水准之上。

关注者数为1,981,311的@任志强 ,他某条被转发了85次的消息转发水准度就是85/1981=0.04,就很不值得上榜(如果不考虑这个因子,那么凭借转发数多评论数多,它肯定可以上榜)。

关注者数为917,734的@头条新闻 ,他某条转发了320次的消息,水准度是320/917=0.34,相当一般的消息,可入可不入榜。

关注者数为434,135的@新浪娱乐 ,某条转发了99次的消息,水准度是99/434=0.22,所以说很多新浪自己维护的帐号,所发的消息大多不值得上榜。

 转发水准度

    因此设置一个转发水准度的阈值,比如要求每条上榜消息的转发水准度大于0.5,就能避免大明星、名人、人气王们随随便便发条消息就能上榜。

[完]

目录
相关文章
|
Kubernetes Java 微服务
Spring Boot与Kubernetes结合:构建高可靠、高性能的微服务架构
Spring Boot与Kubernetes结合:构建高可靠、高性能的微服务架构
470 0
|
Linux Go Windows
NATS服务器部署及测试
版权声明:本文为博主chszs的原创文章,未经博主允许不得转载。 https://blog.csdn.net/chszs/article/details/51002444 NATS服务器部署及测试 作者:chszs,未经博主允许不得转载。
3134 0
|
5月前
|
数据采集 监控 前端开发
如何开发生产小工单中的数字化看板(附架构图+流程图+代码参考)
本文介绍了如何通过数字化看板优化生产小工单管理。内容涵盖生产小工单的概念、数字化看板的功能模块(如生产监控、执行统计、数据统计、员工工资统计)、业务流程设计、技术架构与开发技巧,并提供代码示例,助力企业实现高效、可视化的生产管理。
|
7月前
|
Ubuntu 应用服务中间件 网络安全
关于一些轻量云服务器SSH断连的疑问
在使用2H2G配置的轻量级Ubuntu 22.04服务器时,按照Solana官网教程安装环境,执行`[cargo install]`命令(特别是安装avm和anchor包时),出现SSH连接中断且无法重新登录的问题。推测可能是低配服务器资源耗尽导致SSH进程被终止,即便CPU使用率下降也无法恢复连接,需重启服务器并等待约30分钟才能恢复正常。此现象或与服务器性能限制有关,期待更多测试与解释。
|
前端开发 JavaScript 测试技术
前端自动化测试
前端自动化测试是通过使用工具和脚本自动执行测试用例的过程,旨在提高测试效率、减少人为错误,并确保Web应用的功能在不同环境和设备上的一致性与稳定性。
|
前端开发 JavaScript API
JavaScript 的宏任务和微任务有什么区别
【9月更文挑战第6天】JavaScript 的宏任务和微任务有什么区别
262 5
|
Java 开发者
Java中的异常处理:深入理解try-catch块
【6月更文挑战第15天】在Java编程中,异常处理是一项基本而重要的技能。本文将深入探讨try-catch块的使用,以及如何有效地处理和预防程序中可能出现的异常情况。我们将通过具体的例子和代码片段,详细解析try-catch块的工作原理,以及如何在程序设计中合理地应用这一机制。
226 4
|
SQL 存储
数据权限就该这么实现(实践篇),yyds!
数据权限就该这么实现(实践篇),yyds!
1141 0
|
存储 SQL 人工智能
数据库技术全览:从基础到创新应用
一、引言 在数字化时代,数据是组织和个人决策的关键
|
存储 传感器 监控
理解并利用物联网(IoT)数据的技术探索
【8月更文挑战第11天】物联网数据是数字化转型的重要资源。通过深入理解物联网数据的特性和价值,并采取有效的收集、处理和分析策略,我们可以更好地利用这些数据为企业决策提供支持、优化运营效率、创造新的商业模式并推动数字化转型的深入发展。