Twitter数据流可用于预测流感爆发

简介: 谷歌早在2008年推出了“流感趋势”网站。它建立的假设基础是:人们在遭受疾病困扰时,会比在身体健康时,花更多的时间搜索疾病相关内容。因此,通过分析一个国家,在特定时期的流感相关搜索量,便可以推算出病毒的传播情况。

谷歌早在2008年推出了“流感趋势”网站。它建立的假设基础是:人们在遭受疾病困扰时,会比在身体健康时,花更多的时间搜索疾病相关内容。因此,通过分析一个国家,在特定时期的流感相关搜索量,便可以推算出病毒的传播情况。

这个预测非常靠谱,通常与美国疾病控制和预防中心(CDC)的数据相差无几。事实上,有几次传染病初期的预测,甚至比CDC早了一周之久。众所周知,疾病初期预测将为政府及时采取部署,提供了有利的时机。

那么其他的在线服务,尤其是社交网络,能否做到相同甚至更好的预测呢?如今,问题有了答案。卡耐基梅隆大学的Jiwei Li和康乃尔大学的Claire Cardie,成功利用Twitter预测了早期流感爆发。

他们的方式与谷歌十分类似。首先,他们从Twitter数据流中过滤包含与“流感”相关,并带有位置标签的tweet;然后,在地图上标注这些tweet的位置分布,以及随时间产生的变化。同时,他们还制作了流感的动态变化模型。新模型中,流感包括 4 个阶段:无传染阶段、爆发阶段、稳定阶段以及衰退阶段。

此外,他们采用全新的算法,试图尽快发现不同时期的转换节点。实际上,Li和Cardie在2008年6月至2010年6月间,已经利用100万美国人的360万条tweet,验证了该方法的有效性。 为了检验他们的预测是否成真,Li和Cardie将他们的分析与CDC进行对比。他们说,“我们确信,流感相关tweet与CDC提供的流感疾病案例数目,呈显著相关。”

这看上去是向流感疾病宣战强有力的武器。它不仅为疾病早期预测提供了新方式,同时,挑战了CDC,以及谷歌的流感趋势网站。每年,全球约10-15%的人感染流感,引发5000万流感病例,造成近50万人死亡。这是一个不容忽视的庞大数字。如今,政府和医疗机构可以借用Twitter,更早、更实惠、更便捷得预测疫情,挽救更多的生命。



原文发布时间为:2013-10-13


本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号

相关文章
|
11月前
|
中间件 Go 数据处理
应用golang的管道-过滤器架构风格
【10月更文挑战第1天】本文介绍了一种面向数据流的软件架构设计模式——管道-过滤器(Pipe and Filter),并通过Go语言的Gin框架实现了一个Web应用示例。该模式通过将数据处理流程分解为一系列独立的组件(过滤器),并利用管道连接这些组件,实现了模块化、可扩展性和高效的分布式处理。文中详细讲解了Gin框架的基本使用、中间件的应用以及性能优化方法,展示了如何构建高性能的Web服务。
262 1
|
自然语言处理 数据可视化 数据挖掘
基于python的VR眼镜口碑情感分析,包括lda和情感分析
本文通过Python LDA模型和情感分析技术对京东VR眼镜的用户评论进行深入分析,揭示了消费者对产品的情感倾向、关注点和满意度,为企业提供市场洞察和改进方向。
242 1
基于python的VR眼镜口碑情感分析,包括lda和情感分析
|
人工智能 JavaScript 开发工具
【完全免费】VS Code 最好用的 12 款 AI 代码提示插件!!!
🎉 探索12款免费VSCode AI代码提示插件:Codeium、Codegeex、CodeFuse、TONGYI Lingma、Comate、iFlyCode、Fitten Code、Bito AI、Mintlify Doc Writer、Kodezi AI、aiXcoder、IntelliCode。这些插件提供智能补全、代码生成、注释、优化,支持多种语言,提升编程效率!🚀👩‍💻👨‍💻
16325 0
|
人工智能 数据安全/隐私保护 开发者
AIGC带来的伦理之思
【1月更文挑战第13天】AIGC带来的伦理之思
769 4
AIGC带来的伦理之思
|
安全 Cloud Native Linux
揭秘远程证明架构EAA:机密容器安全部署的最后一环 | 龙蜥技术
如果需要在云上 HW-TEE 环境里启动一个加密容器,如何在启动过程中获取容器的解密密钥?
揭秘远程证明架构EAA:机密容器安全部署的最后一环 | 龙蜥技术
|
Java 缓存 Linux
如何回答性能优化的问题,才能打动阿里面试官?
阿里妹导读:日常工作中,我们多少都会遇到应用的性能问题。在阿里面试中,性能优化也是常被问到的题目,用来考察是否有实际的线上问题处理经验。面对这类问题,阿里工程师齐光给出了详细流程。来阿里面试前,先看看这篇文章哦。
21446 2
如何回答性能优化的问题,才能打动阿里面试官?
|
存储 边缘计算 前端开发
聊聊前后端分离(历史、职责划分、未来发展)
聊聊前后端分离(历史、职责划分、未来发展) 前言 3月下旬了,时间过得真快,才发觉已经有几周没写文章了😠。 前面写了一篇Cookie-Session与JWT对比这样一篇文章,引发了我对未来前后端分离模式的一个思考。你可能会问,这两者能扯上什么关系?请听我慢慢道来... 其实了解这两者区别的应该都清楚,主要就是把登录态的存储是放在前端(用户设备上)存储还是放在后端(服务器)上存储的一个区别,具体的优缺点这里不过多赘述,可以查看一下往期文章。
419 0
|
负载均衡 Java API
【微服务~远程调用】整合RestTemplate、WebClient、Feign
【微服务~远程调用】整合RestTemplate、WebClient、Feign
1255 0
【微服务~远程调用】整合RestTemplate、WebClient、Feign
|
运维 监控
移动端运维,让您随时随地“掌”控管理
监控运维系统已实现移动端运维,系统提供了移动端的监控概览、设备信息查询、告警处理、事件跟踪等功能,用户或运维人员可通过手机,即可实时掌握设备的运行情况,方便运维人同日常化运维需求,减少运维人员的操作强度,通过手机与PC端实时互动,响应派单及故障告警等信息,提高运维效率,为用户提供更好的运维服务。
1061 0
移动端运维,让您随时随地“掌”控管理
|
定位技术
Xbox Series X加载飞快,《大镖客2》仅需25秒
在运行《荒野大镖客:救赎2》时,Xbox One X的加载速度为1分27秒,而Xbox Series X达到了惊人的25秒,超过绝大部分PC。
1063 0
Xbox Series X加载飞快,《大镖客2》仅需25秒