著名统计学家David Cox去世:他提出的「COX回归模型」曾影响一代人

简介: 著名统计学家David Cox去世:他提出的「COX回归模型」曾影响一代人

昨晚,英国著名统计学家 David Cox 去世,享年 97 岁。

image.png

David Cox 因提出「COX 回归模型」而广为人知,并深刻地影响了统计学领域的研究。许多人自发地在社交媒体平台表达了悲痛和哀悼:

image.png



David Cox 生平

David Cox1924 年出生于英国伯明翰,在剑桥大学圣约翰学院学习数学,并在 Henry Daniels 和 Bernard Welch 的指导下于 1949 年在利兹大学获得博士学位。
image.png

1950  年到 1956 年期间,David Cox 在剑桥大学的统计实验室工作。1956 年到 1966  年,他在伦敦大学伯贝克学院担任「Reader」和统计学教授。1966 年,他担任伦敦帝国理工学院统计学系主任,后来成为数学系主任。1988  年,成为纳菲尔德学院的院长和牛津大学统计系的成员,最后于 1994 年正式退休。

David Cox 在统计和应用概率方面做出了开创性的贡献,主要学术贡献包括 Cox 过程,以及影响深远且应用广泛的 Cox 比例风险模型等。
David Cox 曾任国际统计协会、伯努利数理统计与概率学会、英国皇家统计学会主席。同时,他还是英国皇家学会院士暨英国社会科学院院士,美国科学院、丹麦皇家科学院外籍院士。

因其做出的重要贡献,David  Cox 获得皇家统计学会的盖伊奖章(1961 年)和金奖(1973 年),并于 1985 年被英国女王伊丽莎白二世封为爵士。2010  年,他因「对统计理论和应用的开创性贡献」而被授予英国皇家学会科普利奖章。他也是第一个获得国际统计奖(International Prize in  Statistics)的人(2017 年)。

Cox 回归模型

生存分析的统计学领域涉及到一个特定事件发生之前的时间间隔,比如机械故障或者病人死亡。此处发生故障或者病人死亡的比率称为危险函数。

在 1972 年引入的 Cox 比例风险回归模型中,David Cox 提出了一个风险函数,该风险函数分为时间依赖和时间独立两部分。
image.png

论文链接:https://rss.onlinelibrary.wiley.com/share/XB97VAHIGECJZEBBBTWZ?target=10.1111/j.2517-6161.1972.tb00899.x

该模型通常用于医学研究中分析一个或多个前定变量对患者生存时间的影响。由于将依赖时间的输入与不依赖时间的输入分开,医学数据的分析得以大幅简化,Cox  模型在医学研究中得到了广泛的应用。据谷歌学术不完全统计,这篇文章的引用率目前超过 56612 次,也是迄今生存分析中应用最多的多因素分析方法。

image.png
2014 年 10 月,在《Nature》杂志评出的引用次数最多的 100 篇论文之中,Cox 回归成为「引用率最高的三篇统计学论文」之一。

此外,David  Cox 著有许多统计学领域的书籍,包括随机过程理论(与 H.D.Miller 合著,1965 年) ,理论统计(与 d.v. Hinkley  合著,1974 年) ,生存数据分析(与 David Oakes 合著,1984 年) ,以及推论统计学原理(2006 年)。

相关文章
|
19天前
|
机器学习/深度学习 安全 算法
Bengio团队新论文!KL正则化有漏洞,强化学习新策略:不要做我可能不会做的事情
近日,蒙特利尔大学Yoshua Bengio团队发表论文,探讨了强化学习中智能体奖励与设计者效用差异导致的状态分布问题,提出“不要做我可能不会做的事情”策略,通过避免采取受信任政策中可能不采取的行动,有效改善了状态分布,但该策略需依赖受信任政策且可能增加计算成本。
25 5
|
3月前
|
机器学习/深度学习 人工智能
CMU清华教LLM练成数学高手,LeanSTaR训练模型边思考边证明,登顶新SOTA
【9月更文挑战第2天】卡内基梅隆大学与清华大学的研究团队开发出名为LeanSTaR的语言模型,该模型结合形式化验证与机器学习技术,在数学证明上取得了重大突破,实现了类似人类数学家的思考和证明能力。这一成果不仅提升了数学证明任务的性能,尤其在复杂推理方面表现突出,还为数学研究和教育提供了有力支持。论文详细内容可访问 https://arxiv.org/abs/2407.10040。
56 12
|
4月前
|
机器学习/深度学习 自然语言处理
准确率达60.8%,浙大基于Transformer的化学逆合成预测模型,登Nature子刊
【8月更文挑战第29天】浙江大学团队在《Nature》子刊上发表的论文介绍了一款名为EditRetro的基于Transformer架构的化学逆合成预测模型,其准确率高达60.8%,为化学合成领域带来了革命性的变化。此模型无需依赖传统化学反应模板,具备更强的泛化能力和多样化合成路线生成能力,在药物研发和材料科学领域展现出巨大潜力,尽管仍存在一定的错误率和计算资源需求高等挑战。论文详情见:https://www.nature.com/articles/s41467-024-50617-1。
64 3
|
5月前
|
人工智能 算法 数据挖掘
语义熵识破LLM幻觉!牛津大学新研究登Nature
【7月更文挑战第22天】牛津大学研究者在Nature发布"使用语义熵检测大模型幻觉"。语义熵新方法有效识别大模型(LLMs)生成的不实或误导信息,通过聚类分析不同回答的语义等价性并计算概率,展示超越基线的幻觉检测能力,提升LLMs的可靠性。
179 7
|
6月前
|
数据采集 人工智能 算法
ICLR 2024 Spotlight:单模型斩获蛋白质突变预测榜一!西湖大学提出基于结构词表方法
【6月更文挑战第1天】西湖大学团队研发的蛋白质语言模型SaProt,在结构词表方法下,于蛋白质突变预测任务中荣登榜首。SaProt利用Foldseek编码的结构标记理解蛋白质行为,超越现有基准模型,在10个下游任务中表现出色。尽管训练资源需求大,且有特定任务优化空间,但该模型为生物医学研究带来新工具,促进科学理解与合作。论文链接:[https://www.biorxiv.org/content/10.1101/2023.10.01.560349v4](https://www.biorxiv.org/content/10.1101/2023.10.01.560349v4)
208 7
|
7月前
终于有人调查了小模型过拟合:三分之二都有数据污染,微软Phi-3、Mixtral 8x22B被点名
【5月更文挑战第15天】研究人员发现,大型语言模型(LLM)在解决小学算术问题时可能因数据污染导致过拟合,三分之二的模型受影响,包括微软的Phi-3和Mixtral 8x22B。新基准GSM1k显示,一些LLM准确率下降13%,而Gemini/GPT/Claude等展现出较小过拟合。模型对GSM8k的依赖度与其性能差距正相关,提示记忆而非真正推理。论文呼吁研究如何提升LLM的泛化能力。[链接](https://arxiv.org/pdf/2405.00332)
42 2
|
7月前
R语言样条曲线、泊松回归模型估计女性直肠癌患者标准化发病率(SIR)、死亡率(SMR)
R语言样条曲线、泊松回归模型估计女性直肠癌患者标准化发病率(SIR)、死亡率(SMR)
|
7月前
|
存储 Serverless
R语言中的Nelson-Siegel模型在汇率预测的应用
R语言中的Nelson-Siegel模型在汇率预测的应用
|
机器学习/深度学习 自然语言处理 算法
KDD 2023 | 第四范式开发用于分子性质预测的生成式3D预训练模型
KDD 2023 | 第四范式开发用于分子性质预测的生成式3D预训练模型
134 0
|
机器学习/深度学习 算法 决策智能
【NeurIPS 2019】最大熵的蒙特卡洛规划算法
【NeurIPS 2019】最大熵的蒙特卡洛规划算法
112 0