02-在 Kuber SocialBadge 基础上再前进一步

简介:

Kuber 的 SocialBadge 能够根据给出的 Email地址、Twitter用户主页地址、Google User Profile地址等得到:

  • 此人的 Google Reader Shared Items URL(如果有的话);
  • 此人关注哪些人(Twitter、Google Reader等里面的Followings)。

 

测试连接:

1、我的google profile 链接:http://kuber.appspot.com/social/search?q=www.google.com%2Fprofiles%2Fzhengyun

2、我的twitter链接:http://kuber.appspot.com/social/search?q=twitter.com%2Fzhengyun

 

在此基础之上,我希望:

1、给定若干高权重的、社会化媒体重度使用者的 Twitter帐号或Google Profile地址;此用户集合我们称之为:TargetUsers。

2、分别获取每个人的关注列表(此人都关注哪些节点(Node)),此用户集合称为:FollowingNodes。合并重复后,得到一个总的节点集合,称之为:WatchList。

3、针对 WatchList 的每一个Node,遍历之:

检查它对应的Web服务我们是否支持。我们目前暂定支持 Google Reader Shared Items、Twitter、delicious(这些都有链接或短消息)。确定该数据是否有权访问。如果对方未开放权限(访问会得到403状态码),就忽略。

异步收集该Node的数据。如果是GoogleReader就收集它分享的每一篇文章。如果是Twitter,就收集它发布的RT消息和带HTTP链接的消息。如果是delicious,就收集它的收藏链接。

4、针对TargetUsers的每一个用户,逐一计算他关注的世界(FollowingNodes)中:

  • 大家分享最多的文章或链接,仿照SR的算法;
  • 大家转发最多的Twitter消息,仿照锐推榜的算法。

 

目的是:

  • 观察在现有中国社会化媒体使用情况下,个性化计算是否能满足阅读需求。
  • 观察对于收集到的社会化媒体重度使用者,他们所关注的世界的热文和热推是否有价值,对于一般用户来说。
目录
相关文章
|
4月前
|
缓存 前端开发 JavaScript
利用代码分割优化前端性能:策略与实践
在现代Web开发中,代码分割是提升页面加载性能的有效手段。本文介绍代码分割的概念、重要性及其实现策略,包括动态导入、路由分割等方法,并探讨在React、Vue、Angular等前端框架中的具体应用。
|
3月前
|
机器学习/深度学习 存储 运维
分布式机器学习系统:设计原理、优化策略与实践经验
本文详细探讨了分布式机器学习系统的发展现状与挑战,重点分析了数据并行、模型并行等核心训练范式,以及参数服务器、优化器等关键组件的设计与实现。文章还深入讨论了混合精度训练、梯度累积、ZeRO优化器等高级特性,旨在提供一套全面的技术解决方案,以应对超大规模模型训练中的计算、存储及通信挑战。
167 4
|
4月前
|
机器学习/深度学习 存储 监控
实时特征处理框架:构建与优化实践
在大数据时代,实时特征处理框架在机器学习、数据分析和实时监控等领域扮演着至关重要的角色。这类框架能够快速处理和分析海量数据,为决策提供即时的洞察。本文将探讨实时特征处理框架的构建、优化及其在生产环境中的实践应用。
86 1
|
5月前
|
数据采集 自然语言处理 算法
|
5月前
|
C语言
2.5进一步使用C
该程序首先通过注释说明了文件名及程序目的,展示程序说明的必要性。接着,它在同一行内声明了两个变量`feet`和`fathoms`,简化代码结构。随后,利用C语言中的乘法运算符`*`进行简单数学运算,将`fathoms`变量值乘以6并赋给`feet`。最后,使用`printf()`函数以新颖的方式输出多个值,展示了如何在单次调用中打印不同内容。
57 6
|
6月前
|
存储 DataWorks 数据挖掘
方案内容的技术细节评估
该方案通过明确的文档指导、可用的代码示例及数据分析需求评估,提升用户体验。文档需详列操作步骤与资源要求,并提供异常处理指南;代码示例应保持更新,附带错误处理与必要注释;方案需评估数据处理规模、复杂分析功能及实时性需求,以确定是否需额外优化或补充策略。总体而言,方案在基础架构描述上表现良好,但需在技术细节等方面进一步完善。
|
7月前
|
自动驾驶 安全 物联网
5G网络:速度之外的优势深度解析
【8月更文挑战第5天】综上所述,5G网络的优势远不止于其惊人的速度。其超低时延、大规模连接能力、高可靠性和稳定性、灵活频谱利用以及创新的网络切片技术等优势共同构建了一个全新的智能世界。在这个世界里,万物皆可互联、实时交互成为可能,关键业务应用得到可靠保障,频谱资源得到高效利用,网络资源实现高度定制化。5G网络正以前所未有的方式改变着我们的生活和工作方式,引领着未来的智能生活与社会创新。
|
8月前
|
存储
业务系统架构实践问题之为什么按模型划域可能是比按领域划分更好的选择
业务系统架构实践问题之为什么按模型划域可能是比按领域划分更好的选择
|
10月前
|
监控 安全 网络安全
网络安全行为可控定义以及表现内容简述
网络安全行为可控定义以及表现内容简述
139 1
|
10月前
|
人工智能 大数据 5G
400G光模块已经部署,需求将进一步扩大
2023年底,电信运营商完成400G OTN试验网设备部署,标志着400G技术大规模部署的开端。400G传输技术日趋成熟,预计2024年实现长距离商用。400G光模块在提升数据传输效率、降低能耗方面发挥关键作用,适应云计算、大数据、AI对高效算力的需求。光纤技术行业显现复苏态势,400G光模块部署成为数据中心发展的必然,支持新兴技术发展。随着5G、云计算等技术进步,对高速光模块需求激增,推动光纤行业创新与市场扩张。
108 2