对于公共卫生专家来说,如何向公众普及病毒的传播方式和途径是他们最大的挑战
在西非爆发的埃博拉病毒迄今为止已经夺走了超过4000条生命。正当紧急救护小组,医疗慈善机构和非政府组织奋力于控制该病毒的时候,大数据分析能否提供帮助呢?越来越多的数据科学家给予肯定的答案。
移动地图
在一个其他可靠资源都严重匮乏的地区,移动手机被证明是大量数据的可靠来源,因为即便是在非洲最贫穷的国家,移动手机也被广泛拥有。奥林奇(Orange)电信公司在塞内加尔向弗洛明德(Flowminder, 一个瑞典的非营利组织)移交了从150,000部手机里提取的匿名语音和短信信息,此后弗洛明德根据这些信息绘制了该区域的典型人口迁移的详细地图。
那么当局就可以从中看到建立治疗中心的最佳的地方在哪里,也可以知道在哪限制旅游是最有效的控制疫情的方式。然而这些数据的缺陷在于它们是历史性数据,而当局需要的是能够实时反映人口流动情况,因为人口的迁移是会根据疫情的改变而改变的。
这也是为什么美国疾病控制和预防中心(CDC)也从移动运营商那儿收集移动通讯基站的活动数据,从中找出那些打求助热线最多的地方。
西非的移动电话机数据正被用于绘制人口迁移图并且用于预测埃博拉病毒可能的传播方式和路径。
一个地区求助热线呼叫次数的激增将意味着疫情的爆发,同时这一信息也将提醒当局调动更多的资源前往该地。
地图软件公司艾思锐(Esri)正帮助美国疾病控制和预防中心(CDC)可视化这些数据,并且覆盖现有的人口调查数据源来建立一个更丰富的可视化数据画面。根据移动通信基站的活动程度,他们绘制的热点地图可以清晰地反映出人们在哪,以及更关键的,他们正迁移去哪儿,已经迁移了多远。
“我们在之前从来没有过这样大规模的,不具名的手机数据作为一个信息种类,”西班牙电信公司的科学主任纽瑞奥利弗(Nuria Oliver)说道。“最积极的影响是,我们可以帮助紧急救援机构和政府预测疾病可能会如何蔓延。
“在这之前,他们不得不依靠零星的信息,如实地调查,警方和医院的报告。”移动手机也再次被证明是传达健康讯息的一个理想又有效的方式。
霍乱的经验教训
这种手机数据的分析,已经成功应用到其他卫生危机事件。
例如,在2010年,海地地震发生后,瑞典卡罗琳学院和美国哥伦比亚大学的一个联合研究小组分析了来自加勒比运营商Digicel海地网络的两百万台移动电话呼叫的数据。
继2009年的海地地震灾难后, Digicel的移动数据被用来跟踪人口流动的情况。
这使得联合国和其他人道主义机构在救灾行动和随后的霍乱疫情中理解和掌握人口的流动,这意味着他们可以更有效地分配资源,并找出在新的霍乱暴发中风险增加的区域。
1500万部手机的数据分析也被用于反映和预测在肯尼亚疟疾的传播。
但奥利弗女士坦言:“移动数据永远只能帮助我们了解事态的一部分。”
大数据分析能否提供有效性度量?
专家们认为,为了得到一个更全面的了解,我们需要更多的数据源,并具备快速地分析这些数据的能力。
“大数据分析是关于汇集许多不同的数据源,并挖掘数据从而找到模式。” 埃森哲健康卫生咨询总监弗朗西斯戴尔(Frances Dare)说,“我们的数据来源于卫生诊所和医生的报告,媒体报道,社交媒体上的评论信息,公共卫生工作者在实地获得的信息,零售商和药房的交易数据,旅游门票购买数据,热线电话数据,以及地理空间的跟踪数据。”
英国医院的船只RFAArgus准备运送供给去塞拉利昂
英国BAE 系统公司智能及安全部门首席技术官彼得荣格(Peder Jungck)认为,这样的分析也可以用来衡量遏制疫情的政策,教育宣传和治疗手段是否有效。
“例如,医生可以通过分析高风险人群的社交媒体数据集从而得知占多少比例的人正在采取适当的预防措施以减少疾病的传播,以及占多少比例的人忽略了预防提醒。对于埃博拉,研究大数据集的分析师也可以分析潜在的卫生挑战,以及局部环境因素例如天气是否对疾病传播速度有影响。
跨境传播
在这个旅行全球化的时代,病毒的跨境传播比以往更加容易,尤其是对于埃博拉这种具有21天潜伏期的病毒。欧洲和美国都因此处于高度戒备状态,并且在一些机场实施排查。
但是至少在数字化时代,追踪那些潜在的病毒携带者要比以往容易得多。“港口,火车站和机场的数据,以及车牌识别技术,都可以帮助追踪潜在的病毒携带者,并且确定他们可能已经接触过哪些人。”大数据分析公司Qlik的医疗部门主管DavidBolton这样说到。他已经开发了一个埃博拉追踪APP。
从周二开始,希斯罗机场开始对有埃博拉相关症状的乘客进行筛查
通过社交媒体预测流行病趋势
通过社交媒体和搜索引擎上的动态数据,分析师们预测流行病趋势也表现的越来越好。
虽然通过人们使用的关键搜索词的频率来预测可能的感冒病毒爆发的谷歌流感趋势已经被证明是不可靠的,但与此同时,用到了范围更广的数据集的其他方法则得到了更大的成功。
例如,商业咨询公司埃森哲,大数据专业公司SAS和美国北卡罗莱纳大学说他们预测的美国2012-13年度的流感季要比CDC(疾病预防控制中心)的正式警告提前三个月发布。
“通过分析社交媒体,比如博客,网络论坛和推特,我们可以发现公共安全事件的早期预警信号。”埃森哲的Frances Dare这样说到。
“在2013年,我们把表明流感症状的关键词的数目减少为152个,标记出哪些地方这些关键词正在被使用,并且在官方数据公布之前两个月预言了一场流感爆发。”
寻找治疗手段?
Datamonitor Healthcare首席咨询师蒂姆甘布尔(Tim Gamble) 相信,大数据分析还可以帮助理解病毒遗传学特性, 比如为何某些种类的病毒更为致命,为何某些人对病毒更有抵抗力。他曾任职于专注传染性疾病研究制药的美国制药公司Pfizer。他说,“在很多人开始死于艾滋病之前,针对HIV逆转录病毒的治疗并未出现。 我曾参与Pfizer的HIV产品研发工作,我们发现斯堪的纳维亚的一些人比其他人对艾滋病毒有更强的抵抗力。”
埃博拉病毒极具传染性,并且通过血液,呕吐物和粪便传播。
“从而我们研发出了一种药物来模拟那些人抵抗艾滋病病毒的机制。” 他相信此方法同样适用于埃博拉病毒。
简而言之,大数据分析已经在对抗埃博拉的战斗中被应用于各种层面。但正如Qlick的戴维伯顿 所言,“我们还在从头学习,我们从未有过这个级别的数据。因此评价大数据分析是否对疾病的诊断与传播具有重大意义的影响还言之尚早,但是至少大数据分析可以帮助我们决定如何分配我们的资源。”
原文发布时间为:2014-10-21
本文来自云栖社区合作伙伴“大数据文摘”,了解相关信息可以关注“BigDataDigest”微信公众号