IBM研发大数据模型,为控制埃博拉病毒传播大显身手

本文涉及的产品
云原生大数据计算服务MaxCompute,500CU*H 100GB 3个月
简介:

雷锋网AI科技评论按:2014年西非埃博拉疫情给西非当地民众造成巨大伤亡,超过28000人发病,11000多人死亡。三个受疫情影响最严重的非洲国家:塞拉利昂、利比里亚和几内亚,其社会经济已处于崩溃边缘。

 IBM研发大数据模型,为控制埃博拉病毒传播大显身手

照片来源:CDC

从疫情爆发到疫情出现下降趋势这段时间,世界卫生组织 (WHO) 发布了一个旨在增加预防和应急措施、提供紧急护理以及通过提高民众对埃博拉病毒抗感染能力来预疾病蔓延的三阶段方案。雷锋网独家编译,未经许可不得转载。

埃博拉病毒主要由动物携带,是一种能引起人类和大猩猩等灵长类动物产生埃博拉出血热的传染病病毒。由于对病毒缺乏抵抗力,人和灵长类动物一旦被感染埃博拉病毒,生病和死亡的风险都很高。人类与动物(携带病毒没有临床症状)接触后感染病毒的现象,称为溢出事件。很多病毒上都能引发溢出事件,像禽流感或猪流感等众所周知的病毒一样,埃博拉病毒也能引起溢出事件。

虽然蝙蝠和大型蛇类很有可能是动物宿主(或称为病毒载体),但有多少种动物是动物宿主尚未确定。无论是直接触摸还是进食受感染的动物,都会导致疾病在人群中以野火燎原之势蔓延。

为了制定和顺利执行干预措施,研究人员和政府机构通常建立流行病学模型,在模型上分析与疾病相关的大量数据。在疫情盛行期间,为了解疾病的发病原因和分析可能实施的干预措施的潜在影响,包括美国疾病控制中心 (CDC) 等机构的研究人员,研制出可以模拟疾病扩散的数学模型。

增加医院的病床数和实行更便捷的无公害掩埋的倡议,经过彻底验证,证实能显著降低受感染人群的总数。然而很少有模型能研究出动物宿主的数量和疫情的关系,更没有模型考虑过溢出事件的随机性。最近一篇由IBM和蒙特克莱尔州立大学 (Montclair State University) 合作撰写的文章填补了这一空白,研究人员在文章里公布了一个能研究埃博拉病毒从动物宿主感染到人类的开源计算模型。

该模型把溢出事件的随机性考虑在内,还披露如果忽视控制传染路线后果有多严重。在特定情况下,人群和携带病毒动物之间导致感染的接触越多,越有可能在人群中爆发流行。这意味着,即使不存在第二只能传播病毒的动物,疾病也有可能在一个地区爆发。

IBM研发大数据模型,为控制埃博拉病毒传播大显身手

埃博拉病毒体   照片来源:CDC / Frederick A. Murphy

疫情发展到这一步,不论存在多少只能传播病毒的动物,大流行第一幕已经拉开——病毒开始在人群内传播。增加住院率和提高无公害掩埋率等干预措施此时要有效实施也变得更困难,代价也更高昂。而且如果没有快速且强有力的干预措施,大流行在这种情况下自主灭亡的可能性几乎为零。因此,实验里的公共卫生数据揭示了切断人类和动物宿主之间埃博拉病毒的传播链的重要性,从源头上越早解决整个埃博拉疾病传播链,疫情越不可能演变为一次流行,更不可能演变成一次大流行,切断传播链的重要性不应该也不能被低估。

为了帮助人道主义机构的研究员,和让政府和各界人士对资源进行更好地调整分配,使疾病扩散从传播链上得到整体解决,借助Eclipse基金会免费时空流行病学建模框架IBM Research提供以下开源计算模型:

https://www.eclipse.org/forums/index.php/t/1083337/

http://wiki.eclipse.org/Ebola_Models

更多资讯请关注雷锋网。

本文作者:陈鸣鸠

本文转自雷锋网禁止二次转载,原文链接


相关实践学习
基于Hologres轻松玩转一站式实时仓库
本场景介绍如何利用阿里云MaxCompute、实时计算Flink和交互式分析服务Hologres开发离线、实时数据融合分析的数据大屏应用。
基于MaxCompute的热门话题分析
Apsara Clouder大数据专项技能认证配套课程:基于MaxCompute的热门话题分析
相关文章
|
5月前
|
数据采集 机器学习/深度学习 人工智能
面向 MoE 和推理模型时代:阿里云大数据 AI 产品升级发布
2025 AI 势能大会上,阿里云大数据 AI 平台持续创新,贴合 MoE 架构、Reasoning Model 、 Agentic RAG、MCP 等新趋势,带来计算范式变革。多款大数据及 AI 产品重磅升级,助力企业客户高效地构建 AI 模型并落地 AI 应用。
|
2月前
|
机器学习/深度学习 分布式计算 Java
Java 大视界 -- Java 大数据机器学习模型在遥感图像土地利用分类中的优化与应用(199)
本文探讨了Java大数据与机器学习模型在遥感图像土地利用分类中的优化与应用。面对传统方法效率低、精度差的问题,结合Hadoop、Spark与深度学习框架,实现了高效、精准的分类。通过实际案例展示了Java在数据处理、模型融合与参数调优中的强大能力,推动遥感图像分类迈向新高度。
|
2月前
|
机器学习/深度学习 存储 Java
Java 大视界 -- Java 大数据机器学习模型在游戏用户行为分析与游戏平衡优化中的应用(190)
本文探讨了Java大数据与机器学习模型在游戏用户行为分析及游戏平衡优化中的应用。通过数据采集、预处理与聚类分析,开发者可深入洞察玩家行为特征,构建个性化运营策略。同时,利用回归模型优化游戏数值与付费机制,提升游戏公平性与用户体验。
|
2月前
|
机器学习/深度学习 算法 Java
Java 大视界 -- Java 大数据机器学习模型在舆情分析中的情感倾向判断与话题追踪(185)
本篇文章深入探讨了Java大数据与机器学习在舆情分析中的应用,重点介绍了情感倾向判断与话题追踪的技术实现。通过实际案例,展示了如何利用Java生态工具如Hadoop、Hive、Weka和Deeplearning4j进行舆情数据处理、情感分类与趋势预测,揭示了其在企业品牌管理与政府决策中的重要价值。文章还展望了多模态融合、实时性提升及个性化服务等未来发展方向。
|
机器学习/深度学习 数据采集 算法
Java 大视界 -- Java 大数据机器学习模型在金融衍生品定价中的创新方法与实践(166)
本文围绕 Java 大数据机器学习模型在金融衍生品定价中的应用展开,分析定价现状与挑战,阐述技术原理与应用,结合真实案例与代码给出实操方案,助力提升金融衍生品定价的准确性与效率。
Java 大视界 -- Java 大数据机器学习模型在金融衍生品定价中的创新方法与实践(166)
|
11月前
|
存储 缓存 分布式计算
大数据-83 Spark 集群 RDD编程简介 RDD特点 Spark编程模型介绍
大数据-83 Spark 集群 RDD编程简介 RDD特点 Spark编程模型介绍
144 4
|
11月前
|
存储 分布式计算 API
大数据-107 Flink 基本概述 适用场景 框架特点 核心组成 生态发展 处理模型 组件架构
大数据-107 Flink 基本概述 适用场景 框架特点 核心组成 生态发展 处理模型 组件架构
396 0
|
机器学习/深度学习 人工智能
IBM推出创新框架用“黑盒”方式,评估大模型的输出
【7月更文挑战第17天】IBM研发的创新框架以“黑盒”方法评估大模型输出的可信度,通过观察输入和输出,不涉及模型内部。采用逻辑回归模型,基于四个特征(输出长度、多样性、一致性和新颖性)来估计可信度。在多个数据集上测试,显示优于其他“黑盒”方法,且具有可解释性。但仅适用于可访问的模型,可能忽略内部细节,不适用于所有场景。[[arXiv:2406.04370](https://arxiv.org/abs/2406.04370)]
183 4
|
11月前
|
机器学习/深度学习 搜索推荐 大数据
深度解析:如何通过精妙的特征工程与创新模型结构大幅提升推荐系统中的召回率,带你一步步攻克大数据检索难题
【10月更文挑战第2天】在处理大规模数据集的推荐系统项目时,提高检索模型的召回率成为关键挑战。本文分享了通过改进特征工程(如加入用户活跃时段和物品相似度)和优化模型结构(引入注意力机制)来提升召回率的具体策略与实现代码。严格的A/B测试验证了新模型的有效性,为改善用户体验奠定了基础。这次实践加深了对特征工程与模型优化的理解,并为未来的技术探索提供了方向。
478 2
深度解析:如何通过精妙的特征工程与创新模型结构大幅提升推荐系统中的召回率,带你一步步攻克大数据检索难题
|
10月前
|
分布式计算 Java 开发工具
阿里云MaxCompute-XGBoost on Spark 极限梯度提升算法的分布式训练与模型持久化oss的实现与代码浅析
本文介绍了XGBoost在MaxCompute+OSS架构下模型持久化遇到的问题及其解决方案。首先简要介绍了XGBoost的特点和应用场景,随后详细描述了客户在将XGBoost on Spark任务从HDFS迁移到OSS时遇到的异常情况。通过分析异常堆栈和源代码,发现使用的`nativeBooster.saveModel`方法不支持OSS路径,而使用`write.overwrite().save`方法则能成功保存模型。最后提供了完整的Scala代码示例、Maven配置和提交命令,帮助用户顺利迁移模型存储路径。