02-在 Kuber SocialBadge 基础上再前进一步

简介:

Kuber 的 SocialBadge 能够根据给出的 Email地址、Twitter用户主页地址、Google User Profile地址等得到:

  • 此人的 Google Reader Shared Items URL(如果有的话);
  • 此人关注哪些人(Twitter、Google Reader等里面的Followings)。

 

测试连接:

1、我的google profile 链接:http://kuber.appspot.com/social/search?q=www.google.com%2Fprofiles%2Fzhengyun

2、我的twitter链接:http://kuber.appspot.com/social/search?q=twitter.com%2Fzhengyun

 

在此基础之上,我希望:

1、给定若干高权重的、社会化媒体重度使用者的 Twitter帐号或Google Profile地址;此用户集合我们称之为:TargetUsers。

2、分别获取每个人的关注列表(此人都关注哪些节点(Node)),此用户集合称为:FollowingNodes。合并重复后,得到一个总的节点集合,称之为:WatchList。

3、针对 WatchList 的每一个Node,遍历之:

检查它对应的Web服务我们是否支持。我们目前暂定支持 Google Reader Shared Items、Twitter、delicious(这些都有链接或短消息)。确定该数据是否有权访问。如果对方未开放权限(访问会得到403状态码),就忽略。

异步收集该Node的数据。如果是GoogleReader就收集它分享的每一篇文章。如果是Twitter,就收集它发布的RT消息和带HTTP链接的消息。如果是delicious,就收集它的收藏链接。

4、针对TargetUsers的每一个用户,逐一计算他关注的世界(FollowingNodes)中:

  • 大家分享最多的文章或链接,仿照SR的算法;
  • 大家转发最多的Twitter消息,仿照锐推榜的算法。

 

目的是:

  • 观察在现有中国社会化媒体使用情况下,个性化计算是否能满足阅读需求。
  • 观察对于收集到的社会化媒体重度使用者,他们所关注的世界的热文和热推是否有价值,对于一般用户来说。
目录
相关文章
|
2月前
|
机器学习/深度学习 存储 监控
实时特征处理框架:构建与优化实践
在大数据时代,实时特征处理框架在机器学习、数据分析和实时监控等领域扮演着至关重要的角色。这类框架能够快速处理和分析海量数据,为决策提供即时的洞察。本文将探讨实时特征处理框架的构建、优化及其在生产环境中的实践应用。
59 1
|
3月前
|
数据采集 自然语言处理 算法
|
3月前
|
C语言
2.5进一步使用C
该程序首先通过注释说明了文件名及程序目的,展示程序说明的必要性。接着,它在同一行内声明了两个变量`feet`和`fathoms`,简化代码结构。随后,利用C语言中的乘法运算符`*`进行简单数学运算,将`fathoms`变量值乘以6并赋给`feet`。最后,使用`printf()`函数以新颖的方式输出多个值,展示了如何在单次调用中打印不同内容。
48 6
|
5月前
|
自动驾驶 安全 物联网
5G网络:速度之外的优势深度解析
【8月更文挑战第5天】综上所述,5G网络的优势远不止于其惊人的速度。其超低时延、大规模连接能力、高可靠性和稳定性、灵活频谱利用以及创新的网络切片技术等优势共同构建了一个全新的智能世界。在这个世界里,万物皆可互联、实时交互成为可能,关键业务应用得到可靠保障,频谱资源得到高效利用,网络资源实现高度定制化。5G网络正以前所未有的方式改变着我们的生活和工作方式,引领着未来的智能生活与社会创新。
|
6月前
|
机器学习/深度学习 自然语言处理 算法
大模型技术基础
【7月更文挑战第26天】大模型技术基础
126 6
|
8月前
|
人工智能 大数据 5G
400G光模块已经部署,需求将进一步扩大
2023年底,电信运营商完成400G OTN试验网设备部署,标志着400G技术大规模部署的开端。400G传输技术日趋成熟,预计2024年实现长距离商用。400G光模块在提升数据传输效率、降低能耗方面发挥关键作用,适应云计算、大数据、AI对高效算力的需求。光纤技术行业显现复苏态势,400G光模块部署成为数据中心发展的必然,支持新兴技术发展。随着5G、云计算等技术进步,对高速光模块需求激增,推动光纤行业创新与市场扩张。
85 2
|
8月前
|
机器学习/深度学习 数据采集 算法
构建高效机器学习模型的策略与优化方法
在机器学习领域,构建一个既高效又准确的预测模型是每个数据科学家追求的目标。本文将探讨一系列策略和优化方法,用于提高机器学习模型的性能和效率。我们将从数据处理技巧、特征选择、算法调优以及模型评估等方面进行详细讨论。特别地,文章将重点介绍如何通过集成学习和自动化模型调优工具来提升模型的泛化能力。这些技术不仅能帮助减少过拟合的风险,还能确保模型在未知数据集上的表现更加鲁棒。
|
XML 数据格式
进一步了解XPath
进一步了解XPath
|
前端开发 JavaScript NoSQL
第一次提供技术服务涉及的技术点和思考过程
一年前的今天,我肯定还不敢做前后端联动的工程,没有这个视野。如今有了些许,不敢自傲,还需学习。今天我站在稍上一点的角度,谈一谈我的思考过程及技术点。
91 0
|
机器学习/深度学习 数据采集 自然语言处理
高级能力和算法效果优化 | 学习笔记
简介:快速学习高级能力和算法效果优化
201 0
高级能力和算法效果优化 | 学习笔记

热门文章

最新文章