如何测量Google Reader用户的分享活跃度

简介:

郑昀 20090918

1、背景知识

Google Reader 用户可以再次分享他订阅的文章,只要获知某一个用户的User ID,即可通过以下格式访问他的:

(0919注:UserID并不是ProfileID,你可以从shared items 主页的html代码里找到Profile ID。)
用户还可以对某篇文章表示Like。

    通过对Shared和Like行为的数据收集,并构造一个简单的公式,可以大致测量出Google Reader用户的分享活跃度,简称GRUserRank。

GRUserRank 的用途:

  • 是一个参考指标,当估计用户对某一篇热门文章的推荐贡献时;
  • 能有效地区别对待用户,把活跃用户、分享质量低的用户、休眠用户分开,有利于优化程序;
  • 也是一种社会化的参考指标。

 

2、如何遍历

    xlvector 在《Google Reader的数据收集》中提及,因为每一个Shared Items Feed给出了like它的用户id(具体逻辑请参考我的文章《Google Reader的Likes操作数据如何获取?》),所以只要从某一批用户的Shared Item Feed出发,就可以通过广度优先搜索将整个Google Reader的用户数据抓下来。这个数据集可以说内容非常丰富,包含了时间和内容信息,相信在它的基础上可以做出不少工作。

 

3、分享活跃度的计算公式

这个思路是可以用来计算 GRUserRank 的。

第一步,

我们从 玩聚SR 的已收集GR用户ID集合(基本能保证都是中文用户)开始,扫描每一个用户的Shared Items Feed,根据正则表达式:

<gr:likingUser>([0-9a-z_!~*'()-]+)</gr:likingUser>

从中获取所有 likingUser 的ID,存入全局字典,统计每一个User最近作出Like操作的次数(变量简称Likes),保证唯一性。

 

A unique show第二步,

这样,我们拿到了一个很大的GReader User ID集合(简称LikingUsers),由于主要是对中文文章做like操作的用户,所以也基本是中文用户。当然这个集合里:

  • 并不能遍历到所有的GReader中文用户;
  • 并不是所有人都公开了自己的Shared Items;
  • 只有少部分人创建了Google Profile,拥有自己的Logo。

接下来,我们遍历 LikingUsers 集合,按照 Likes 的顺序,即经常标记Like的用户优先遍历。

对于每一个用户,要拿到以下数值:

  • 三十天内是否分享过文章:没有的话,说明此用户已经是休眠用户;
  • 四天内分享过多少文章:变量简称Shares;
  • 最近分享的三篇文章的发表时间新鲜度:变量简称FreshMeats。用每一篇文章发表时间减去一个基准时间值(我取前四天的日期作为基准,如今日是9月18日,那么基准时间是2009-09-15),然后取平均值。
  • 最近分享的三篇文章的标题是否都不包含中文:如果都不包含中文,说明该用户也许不是中文用户,可以disable了。

 

第三步,

按照我的文章《Social Media排序算法的四种模式》,我们还要指定一个时间基数:

BaseSeconds :12.5 小时周期内的总秒数,45000秒。

 

那么公式就是: 
GRUserRank = Log10(Likes*因子A+Shares*因子B)+FreshMeats/BaseSeconds

因子A、B自己调整,我取2和3。

目录
相关文章
|
API
google reader api,互联网营销
Google Reader 是一个使用了大量JavaScript构建的feed聚合器,它能非常及时地抓取最新的feed数据。Google的Ajax前台调用到的数据采用了Atom格式,这种数据技术降低了Google Reader的开发难度,同时也使得第三方应用很容易对其进行扩展。
1119 0
纪念google reader
2013年3月14日早上,谷歌在其官方博客宣布,2005年推出的 Google Reader 将在7月1号关闭。 google reader的历史 以下搞自维基百科http://zh.wikipedia.org/wiki/Google%E9%98%85%E8%AF%BB%E5%99%A8 Google阅读器(Google Reader)是Google公司旗下一个基于网络的聚合器,能在线或者离线阅读Atom和RSS。
|
Android开发 iOS开发
gReader 将死,8款 Google Reader 替代品
昨天很多人应该都知道 Google Reader 已经被 Google 下了终结通告,将在今年7月1日被关闭,对于广大用户来说实在是个坏消息,有心悼念的朋友可以在那天点上蜡烛。
1211 0
|
Web App开发 JavaScript 前端开发
Feedly:替代 Google Reader 的最佳 RSS 阅读器
  Google Reader 将要关闭已是事实,唯一的办法就是尽快找到一个替代品,Feedly 是公认的替代 Google Reader 的最佳 RSS  阅读器。之前了解这款国外的 RSS 订阅工具的朋友不是很多,这篇文章向大家做个简单介绍。
1149 0
|
JavaScript 前端开发
Google Reader 将关闭,五大替代产品推荐
  谷歌今天宣布,将于今年7月1日关闭 RSS 订阅服务 Google Reader。数以百万记的爱好者迅速陷入恐慌,并且开始寻找其它合适的替代产品。本文向大家推荐5个同样出色的新闻订阅服务。 您可能感兴趣的相关文章 2012年排名前20位的 CSS 网站作品 12款很棒的浏览器兼容性测试工具推荐 构建杀手级应用 JavaScript 工具和技术 10套精美的免费网站后台管理系统模板 2012年最佳 Web 前端开发工具和框架     理想情况之下,一个好的 RSS 阅读器,应该能够适应移动设备和台式机的需求。
895 0