斯坦福春季新课:用数据科学、机器学习对COVID-19研究建模

简介: 斯坦福春季新课:用数据科学、机器学习对COVID-19研究建模

冠状病毒全球肆虐,全球的研究和开发人员正在尽最大努力遏制和预防COVID-19。近日,已经开启远程课程的斯坦福大学新开放了一门特别的春季课程。

这门课程是针对新冠的专项课程,名为《用数据科学、机器学习工具对COVID-19新型冠状病毒进行研究与建模(CS472 Data science and AI for COVID-19)》,重点研究如何使用数据科学和机器学习的工具对COVID-19进行调查和建模。

课程传送门:

https://sites.google.com/view/data-science-covid-19/homepage

这也是全球主要高校首次为新冠肺炎开设专门课程。

开设这门课程的讲师将是James Zou教授,他是斯坦福大学生物医学数据科学的助理教授,同时担任斯坦福大学计算机科学和电气工程专业的教授。研究机器学习中的各种问题(从证明数学性质到构建大规模算法),并且对基因组学和计算健康方面的应用特别感兴趣,是Microsoft Research的成员。

这门课程将介绍COVID-19病毒的生物学和流行病学的相关背景。需要学生批判性的思考、监测当前用于预测人群感染率的模型以及用于支持各种公共卫生干预措施(例如,畜群免疫力和社会距离)的模型。

据课程介绍,本次课程核心是旨在创建可帮助正在进行的全球卫生工作的工具的项目。潜在的项目包括数据可视化和教育平台,改进的建模和预测,对COVID-19信息传播的社交网络和NLP分析,以及实现健康的工具。

该课程面向具有一定数据科学和人工智能经验的学生,并将包括生物医学专家的客座演讲。

(可以参考  CS229,STATS216或同等学历,具有一定生物学背景会有所帮助,但不是必需的)。

示例项目包括改进流行病学预测模型,建模和预测各种干预政策的影响,分析COVID-19信息如何在Twitter上传播,安全共享COVID-19患者特征和结果的平台以及COVID-19基因组分析的平台。

课程基于目前已有的数据,提供了一系列供使用的数据库,包括病理学相关和自然语言数据相关数据库👇    

课程大纲

4月10日–大流行Nigam Shah来宾期间的COVID-19和卫生系统概述

4月17日–流行病学预测和建模

4月24日–COVID-19米歇尔·巴里(Michele Barry)来宾的传染病背景

5月1日–项目提案

5月8日–ML用于COVID-19药物Russ Altman来宾

5月15日–COVID-19基因组分析Julia Palacios来宾

5月22日–项目里程碑演示

5月29日–NLP在Twitter和FB上分析了COVID-19信息

6月5日–最终演示



相关文章
|
1天前
|
机器学习/深度学习 存储 设计模式
特征时序化建模:基于特征缓慢变化维度历史追踪的机器学习模型性能优化方法
本文探讨了数据基础设施设计中常见的一个问题:数据仓库或数据湖仓中的表格缺乏构建高性能机器学习模型所需的历史记录,导致模型性能受限。为解决这一问题,文章介绍了缓慢变化维度(SCD)技术,特别是Type II类型的应用。通过SCD,可以有效追踪维度表的历史变更,确保模型训练数据包含完整的时序信息,从而提升预测准确性。文章还从数据工程师、数据科学家和产品经理的不同视角提供了实施建议,强调历史数据追踪对提升模型性能和业务洞察的重要性,并建议采用渐进式策略逐步引入SCD设计模式。
15 8
特征时序化建模:基于特征缓慢变化维度历史追踪的机器学习模型性能优化方法
|
3月前
|
机器学习/深度学习 测试技术
阿里云入选Gartner数据科学和机器学习平台挑战者象限
Gartner® 正式发布了《数据科学与机器学习平台魔力象限》报告(Magic Quadrant™ for Data Science and Machine Learning Platforms),阿里云成为唯一一家入选该报告的中国厂商,被评为“挑战者”(Challengers)。
|
2月前
|
机器学习/深度学习 数据采集 数据可视化
Python数据科学实战:从Pandas到机器学习
Python数据科学实战:从Pandas到机器学习
|
3月前
|
机器学习/深度学习 数据采集 数据挖掘
特征工程在营销组合建模中的应用:基于因果推断的机器学习方法优化渠道效应估计
因果推断方法为特征工程提供了一个更深层次的框架,使我们能够区分真正的因果关系和简单的统计相关性。这种方法在需要理解干预效果的领域尤为重要,如经济学、医学和市场营销。
99 1
特征工程在营销组合建模中的应用:基于因果推断的机器学习方法优化渠道效应估计
|
7月前
|
机器学习/深度学习 数据采集 搜索推荐
机器学习在智能推荐系统中的个性化算法研究
机器学习在智能推荐系统中的个性化算法研究
|
2月前
|
机器学习/深度学习
自动化机器学习研究MLR-Copilot:利用大型语言模型进行研究加速
【10月更文挑战第21天】在科技快速发展的背景下,机器学习研究面临诸多挑战。为提高研究效率,研究人员提出了MLR-Copilot系统框架,利用大型语言模型(LLM)自动生成和实施研究想法。该框架分为研究想法生成、实验实施和实施执行三个阶段,通过自动化流程显著提升研究生产力。实验结果显示,MLR-Copilot能够生成高质量的假设和实验计划,并显著提高任务性能。然而,该系统仍需大量计算资源和人类监督。
43 4
|
2月前
|
机器学习/深度学习 数据可视化 数据处理
掌握Python数据科学基础——从数据处理到机器学习
掌握Python数据科学基础——从数据处理到机器学习
50 0
|
5月前
|
机器学习/深度学习 API 网络架构
"解锁机器学习超级能力!Databricks携手Mlflow,让模型训练与部署上演智能风暴,一触即发,点燃你的数据科学梦想!"
【8月更文挑战第9天】机器学习模型的训练与部署流程复杂,涵盖数据准备、模型训练、性能评估及部署等步骤。本文详述如何借助Databricks与Mlflow的强大组合来管理这一流程。首先需在Databricks环境内安装Mlflow库。接着,利用Mlflow跟踪功能记录训练过程中的参数与性能指标。最后,通过Mlflow提供的模型服务功能,采用REST API或Docker容器等方式部署模型。这一流程充分利用了Databricks的数据处理能力和Mlflow的生命周期管理优势。
203 7
|
5月前
|
机器学习/深度学习 存储 分布式计算
Hadoop与机器学习的融合:案例研究
【8月更文第28天】随着大数据技术的发展,Hadoop已经成为处理大规模数据集的重要工具。同时,机器学习作为一种数据分析方法,在各个领域都有着广泛的应用。本文将介绍如何利用Hadoop处理大规模数据集,并结合机器学习算法来挖掘有价值的信息。我们将通过一个具体的案例研究——基于用户行为数据预测用户留存率——来展开讨论。
375 0
|
6月前
|
机器学习/深度学习 数据采集 存储
在机器学习和数据科学中,数据预处理是一个至关重要的步骤。数据规范化(或称为特征缩放)是预处理的一种常见技术,它可以帮助我们改进模型的性能。`sklearn.preprocessing`模块提供了多种数据规范化的方法,其中`StandardScaler`和`MinMaxScaler`是最常用的两种。
在机器学习和数据科学中,数据预处理是一个至关重要的步骤。数据规范化(或称为特征缩放)是预处理的一种常见技术,它可以帮助我们改进模型的性能。`sklearn.preprocessing`模块提供了多种数据规范化的方法,其中`StandardScaler`和`MinMaxScaler`是最常用的两种。