01-学习 Kuber 的 SocialBadge 好榜样 | 02.技术预研 | Social

简介:

01-学习 Kuber 的 SocialBadge 好榜样

郑昀 20100510 隶属于《02.技术预研》小节

Kuber 是我们做社会化推荐个性化计算的同路人。我和他一直在讨论相关应用和技术。

最近 Kuber 推出了 SocialBadge ,是利用 google social graph api 做的。 
SocialBadge 算是社会化推荐封闭社区的预研 demo 了。有了这个雏形,面向全球 Social 重度用户的个性化推荐计算有了可能。

 

它的页面简单解释

页面展示的数据,基本都是通过页面的 Javascript 解析各种API(json格式的)而来,没有什么后台。

1、 
Reading Stream 异步显示的 google reader shared items/delicious 数据是 javascript 临时从json提取的。比如,通过你输入的邮件地址、Twitter链接、Google帐号等字符串,让Social Graph查询到你的 Google Reader Shared 公开链接,然后由Yahoo! Pipe把它的RSS烧制成json格式。 
2、 
如果你什么都没查到,可能是因为GFW屏蔽了Google,也可能是因为你的输入在Social Graph里查不到数据。 

它的工作原理

首先,它是把 twitter.com/kuber 的字符串提交给 google social graph 的 lookup 方法,如下面的链接: 
http://socialgraph.apis.google.com/lookup?q=twitter.com/kuber&fme=1&jme=1&edi=1&edo=1&pretty=1

得到了一部分 claimed nodes ,然后继续把这些 nodes 构造进 lookup 方法的 URL里,发起第二次请求(这是因为第一次取得的 link 太少,再发一次取得更多链接):

http://socialgraph.apis.google.com/lookup?q=

http://twitter.com/kuber,

http://www.cnblogs.com/kuber,

http://www.feedzshare.com/,

http://friendfeed.com/kuber,

http://www.google.com/profiles/113557210616935738114

&fme=1&jme=1&edi=0&edo=1&pretty=1

(真实链接请点击:http://is.gd/c239A ,有时会被 GFW 重置)(多个 link 可以用逗号分隔提交给Google)

 

像页面上 Kuber 得到了他豆瓣的链接:http://www.douban.com/people/kuber/miniblogs ,这种链接不一定是google profile 里面列的, 但是google profile 肯定是重要的数据源。比如说你的blog里面列出了豆瓣, 也会在Social Graph里面。关键是XFN(XFN,XHTML Friends Network,XHTML社交网络,http://gmpg.org/xfn/ ,是一个通过XHTML标记语言在网页上表示人与人之间的社交关系的方法。)。

“Followings”列表里也不仅仅是Twitter的好友,blog 里面列出来的友情链接也可能。但遗憾的是,Social Graph API尚无法给出Google Profile里呈现的你的关注列表,或者Google Reader里你关注的对象。

Google Social Graph 还会错判某个节点隶属于你,比如搜 twitter.com/zhengyun ,列出的一个 friendfeed 帐号就是错误的、不存在的。我不能说这种误判属于偶然,但如果让你做,你未必能比Google做得更好。

 

如果一度好友少的话

Social Graph还会考虑二度好友。比如说一个 Flickr 用户,在 Flickr 上有朋友,由此连接到这个朋友的twitter好友,即A->B->C。还可以再加入二度好友的 GReader 和 Delicious 。二度好友就是权重低些。二度好友可以根据交流活跃度来算权重。比如说我只有你一个好友, 你经常RT、Reply的人才会算进去。

 

社会化推荐个性化社区的终极目的

我觉得最终目的是提供一个普世的个性化阅读社区。手段可以丰富多彩甚至为各个国家的二度开发者开放接口。比如对于中国大陆,可以加入豆瓣、天涯社区等常用服务的支持。否则如果只是面向 Social 重度使用者提供服务,人群太窄。

目录
相关文章
|
Rust 算法 数据安全/隐私保护
【密码学】一文读懂XTEA加密
本篇文章,我们来看一下上一次讲过的TEA加密算法的一个升级版XTEA, 相比于TEA, XTEA的安全性显然是更高的,其中的过程要比TEA稍微复杂一点点。
1503 0
【密码学】一文读懂XTEA加密
|
6月前
|
人工智能 搜索推荐
「社会实验室」成真!SocioVerse:复旦联合小红书开源社会模拟世界模型,用AI预演群体行为
SocioVerse是由复旦大学联合小红书等机构开源的社会模拟框架,基于大语言模型和千万级真实用户数据构建,能精准模拟群体行为并预测社会事件演化趋势。
399 2
「社会实验室」成真!SocioVerse:复旦联合小红书开源社会模拟世界模型,用AI预演群体行为
|
Ubuntu Linux vr&ar
IM跨平台技术学习(十二):万字长文详解QQ Linux端实时音视频背后的跨平台实践
本文详细记录了新版QQ音视频通话在 Linux 平台适配开发过程中的技术方案与实现细节,希望能帮助大家理解在 Linux 平台从 0 到 1 实现音视频通话能力的过程。
493 2
|
9月前
|
存储 监控 druid
Druid、ClickHouse、Doris、StarRocks 的区别与分析
本文对比了 Druid、ClickHouse、Doris 和 StarRocks 四款大数据分析引擎。它们均为 OLAP 引擎,采用列式存储和分布式架构,适用于海量数据分析。Druid 擅长实时分析与高并发查询;ClickHouse 以超高性能著称,适合复杂查询;Doris 提供易用的 SQL 接口,性能均衡;StarRocks 则以其极速查询和实时更新能力脱颖而出。各引擎在数据模型、查询性能、数据更新和存储方面存在差异,适用于不同的业务场景。选择时需根据具体需求综合考虑。
4089 20
|
10月前
|
数据库
脏读、幻读、不可重复读的定义?
脏读、不可重复读和幻读是数据库事务处理中的三种异常现象。脏读指读取未提交的修改数据;不可重复读指同一事务中多次读取数据不一致;幻读指读取记录范围时,前后读取结果数量不一致。这些现象通常由并发事务操作引起。
393 7
|
运维 监控 安全
DevOps实践:构建高效运维团队的五大策略
在当今快速发展的IT领域,DevOps已成为提升软件开发和运维效率的关键。本文将深入探讨如何通过实施五大策略来构建一个高效的运维团队,包括自动化流程、持续改进、协作文化、监控与响应以及安全优先。这些策略旨在帮助组织缩短开发周期,提高软件质量,同时确保系统的稳定性和安全性。
332 32
|
安全 算法 数据安全/隐私保护
CSRF 实验:Token 不与 Session 绑定绕过验证
CSRF 实验:Token 不与 Session 绑定绕过验证
|
缓存 NoSQL 关系型数据库
|
算法 安全 测试技术
【软件测试】用例篇 -- 详解(上)
【软件测试】用例篇 -- 详解(上)