IBM研发大数据模型,为控制埃博拉病毒传播大显身手

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
云原生大数据计算服务 MaxCompute,5000CU*H 100GB 3个月
简介:

雷锋网AI科技评论按:2014年西非埃博拉疫情给西非当地民众造成巨大伤亡,超过28000人发病,11000多人死亡。三个受疫情影响最严重的非洲国家:塞拉利昂、利比里亚和几内亚,其社会经济已处于崩溃边缘。

 IBM研发大数据模型,为控制埃博拉病毒传播大显身手

照片来源:CDC

从疫情爆发到疫情出现下降趋势这段时间,世界卫生组织 (WHO) 发布了一个旨在增加预防和应急措施、提供紧急护理以及通过提高民众对埃博拉病毒抗感染能力来预疾病蔓延的三阶段方案。雷锋网独家编译,未经许可不得转载。

埃博拉病毒主要由动物携带,是一种能引起人类和大猩猩等灵长类动物产生埃博拉出血热的传染病病毒。由于对病毒缺乏抵抗力,人和灵长类动物一旦被感染埃博拉病毒,生病和死亡的风险都很高。人类与动物(携带病毒没有临床症状)接触后感染病毒的现象,称为溢出事件。很多病毒上都能引发溢出事件,像禽流感或猪流感等众所周知的病毒一样,埃博拉病毒也能引起溢出事件。

虽然蝙蝠和大型蛇类很有可能是动物宿主(或称为病毒载体),但有多少种动物是动物宿主尚未确定。无论是直接触摸还是进食受感染的动物,都会导致疾病在人群中以野火燎原之势蔓延。

为了制定和顺利执行干预措施,研究人员和政府机构通常建立流行病学模型,在模型上分析与疾病相关的大量数据。在疫情盛行期间,为了解疾病的发病原因和分析可能实施的干预措施的潜在影响,包括美国疾病控制中心 (CDC) 等机构的研究人员,研制出可以模拟疾病扩散的数学模型。

增加医院的病床数和实行更便捷的无公害掩埋的倡议,经过彻底验证,证实能显著降低受感染人群的总数。然而很少有模型能研究出动物宿主的数量和疫情的关系,更没有模型考虑过溢出事件的随机性。最近一篇由IBM和蒙特克莱尔州立大学 (Montclair State University) 合作撰写的文章填补了这一空白,研究人员在文章里公布了一个能研究埃博拉病毒从动物宿主感染到人类的开源计算模型。

该模型把溢出事件的随机性考虑在内,还披露如果忽视控制传染路线后果有多严重。在特定情况下,人群和携带病毒动物之间导致感染的接触越多,越有可能在人群中爆发流行。这意味着,即使不存在第二只能传播病毒的动物,疾病也有可能在一个地区爆发。

IBM研发大数据模型,为控制埃博拉病毒传播大显身手

埃博拉病毒体   照片来源:CDC / Frederick A. Murphy

疫情发展到这一步,不论存在多少只能传播病毒的动物,大流行第一幕已经拉开——病毒开始在人群内传播。增加住院率和提高无公害掩埋率等干预措施此时要有效实施也变得更困难,代价也更高昂。而且如果没有快速且强有力的干预措施,大流行在这种情况下自主灭亡的可能性几乎为零。因此,实验里的公共卫生数据揭示了切断人类和动物宿主之间埃博拉病毒的传播链的重要性,从源头上越早解决整个埃博拉疾病传播链,疫情越不可能演变为一次流行,更不可能演变成一次大流行,切断传播链的重要性不应该也不能被低估。

为了帮助人道主义机构的研究员,和让政府和各界人士对资源进行更好地调整分配,使疾病扩散从传播链上得到整体解决,借助Eclipse基金会免费时空流行病学建模框架IBM Research提供以下开源计算模型:

https://www.eclipse.org/forums/index.php/t/1083337/

http://wiki.eclipse.org/Ebola_Models

更多资讯请关注雷锋网。

本文作者:陈鸣鸠

本文转自雷锋网禁止二次转载,原文链接


相关实践学习
基于MaxCompute的热门话题分析
本实验围绕社交用户发布的文章做了详尽的分析,通过分析能得到用户群体年龄分布,性别分布,地理位置分布,以及热门话题的热度。
SaaS 模式云数据仓库必修课
本课程由阿里云开发者社区和阿里云大数据团队共同出品,是SaaS模式云原生数据仓库领导者MaxCompute核心课程。本课程由阿里云资深产品和技术专家们从概念到方法,从场景到实践,体系化的将阿里巴巴飞天大数据平台10多年的经过验证的方法与实践深入浅出的讲给开发者们。帮助大数据开发者快速了解并掌握SaaS模式的云原生的数据仓库,助力开发者学习了解先进的技术栈,并能在实际业务中敏捷的进行大数据分析,赋能企业业务。 通过本课程可以了解SaaS模式云原生数据仓库领导者MaxCompute核心功能及典型适用场景,可应用MaxCompute实现数仓搭建,快速进行大数据分析。适合大数据工程师、大数据分析师 大量数据需要处理、存储和管理,需要搭建数据仓库?学它! 没有足够人员和经验来运维大数据平台,不想自建IDC买机器,需要免运维的大数据平台?会SQL就等于会大数据?学它! 想知道大数据用得对不对,想用更少的钱得到持续演进的数仓能力?获得极致弹性的计算资源和更好的性能,以及持续保护数据安全的生产环境?学它! 想要获得灵活的分析能力,快速洞察数据规律特征?想要兼得数据湖的灵活性与数据仓库的成长性?学它! 出品人:阿里云大数据产品及研发团队专家 产品 MaxCompute 官网 https://www.aliyun.com/product/odps 
相关文章
|
6月前
|
Java Shell 分布式数据库
【大数据技术Hadoop+Spark】HBase数据模型、Shell操作、Java API示例程序讲解(附源码 超详细)
【大数据技术Hadoop+Spark】HBase数据模型、Shell操作、Java API示例程序讲解(附源码 超详细)
157 0
|
1月前
|
存储 缓存 分布式计算
大数据-83 Spark 集群 RDD编程简介 RDD特点 Spark编程模型介绍
大数据-83 Spark 集群 RDD编程简介 RDD特点 Spark编程模型介绍
38 4
|
1月前
|
存储 分布式计算 API
大数据-107 Flink 基本概述 适用场景 框架特点 核心组成 生态发展 处理模型 组件架构
大数据-107 Flink 基本概述 适用场景 框架特点 核心组成 生态发展 处理模型 组件架构
85 0
|
4月前
|
机器学习/深度学习 人工智能
IBM推出创新框架用“黑盒”方式,评估大模型的输出
【7月更文挑战第17天】IBM研发的创新框架以“黑盒”方法评估大模型输出的可信度,通过观察输入和输出,不涉及模型内部。采用逻辑回归模型,基于四个特征(输出长度、多样性、一致性和新颖性)来估计可信度。在多个数据集上测试,显示优于其他“黑盒”方法,且具有可解释性。但仅适用于可访问的模型,可能忽略内部细节,不适用于所有场景。[[arXiv:2406.04370](https://arxiv.org/abs/2406.04370)]
55 4
|
24天前
|
分布式计算 Java 开发工具
阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
本文介绍了XGBoost在MaxCompute+OSS架构下模型持久化遇到的问题及其解决方案。首先简要介绍了XGBoost的特点和应用场景,随后详细描述了客户在将XGBoost on Spark任务从HDFS迁移到OSS时遇到的异常情况。通过分析异常堆栈和源代码,发现使用的`nativeBooster.saveModel`方法不支持OSS路径,而使用`write.overwrite().save`方法则能成功保存模型。最后提供了完整的Scala代码示例、Maven配置和提交命令,帮助用户顺利迁移模型存储路径。
ly~
|
1月前
|
供应链 搜索推荐 安全
大数据模型的应用
大数据模型在多个领域均有广泛应用。在金融领域,它可用于风险评估与预测、智能营销及反欺诈检测,助力金融机构做出更加精准的决策;在医疗领域,大数据模型能够协助疾病诊断与预测、优化医疗资源管理和加速药物研发;在交通领域,该技术有助于交通流量预测、智能交通管理和物流管理,从而提升整体交通效率;电商领域则借助大数据模型实现商品推荐、库存管理和价格优化,增强用户体验与企业效益;此外,在能源和制造业中,大数据模型的应用范围涵盖从需求预测到设备故障预测等多个方面,全面推动了行业的智能化转型与升级。
ly~
113 2
|
1月前
|
Oracle 大数据 数据挖掘
企业内训|大数据产品运营实战培训-某电信运营商大数据产品研发中心
本课程是TsingtaoAI专为某电信运营商的大数据产品研发中心的产品支撑组设计,旨在深入探讨大数据在电信运营商领域的应用与运营策略。通过密集的培训,从数据的本质与价值出发,系统解析大数据工具和技术的最新进展,深入剖析行业内外的实践案例。课程涵盖如何理解和评估数据、如何有效运用大数据技术、以及如何在不同业务场景中实现数据的价值转化。
44 0
|
3月前
|
分布式计算 并行计算 大数据
【数据挖掘】百度2015大数据云计算研发笔试卷
百度2015年大数据云计算研发笔试卷的题目总结,涵盖了Hadoop、Spark、MPI计算框架特点、TCP连接建立过程、数组最大和问题、二分查找实现以及灯泡开关问题,提供了部分题目的解析和伪代码。
55 1
|
5月前
|
机器学习/深度学习 人工智能 分布式计算
人工智能平台PAI产品使用合集之在maxcompute上跑模型,如何在本地进行推理
阿里云人工智能平台PAI是一个功能强大、易于使用的AI开发平台,旨在降低AI开发门槛,加速创新,助力企业和开发者高效构建、部署和管理人工智能应用。其中包含了一系列相互协同的产品与服务,共同构成一个完整的人工智能开发与应用生态系统。以下是对PAI产品使用合集的概述,涵盖数据处理、模型开发、训练加速、模型部署及管理等多个环节。
人工智能平台PAI产品使用合集之在maxcompute上跑模型,如何在本地进行推理
|
4月前
|
数据采集 自然语言处理 大数据
​「Python大数据」LDA主题分析模型
使用Python进行文本聚类,流程包括读取VOC数据、jieba分词、去除停用词,应用LDA模型(n_components=5)进行主题分析,并通过pyLDAvis生成可视化HTML。关键代码涉及数据预处理、CountVectorizer、LatentDirichletAllocation以及HTML文件的本地化处理。停用词和业务术语列表用于优化分词效果。
240 0
​「Python大数据」LDA主题分析模型
下一篇
无影云桌面