R实战 | Nomogram(诺莫图/列线图)及其Calibration校准曲线绘制

简介: R实战 | Nomogram(诺莫图/列线图)及其Calibration校准曲线绘制

R实战|Nomogram(诺莫图/列线图)及其Calibration校准曲线绘制


Nomogram,中文常称为诺莫图或者列线图。简单的说是将Logistic回归或Cox回归的结果进行可视化呈现。它根据所有自变量回归系数的大小来制定评分标准,给每个自变量的每个取值水平一个评分;对于每个患者,就可计算得到一个总分,再通过得分与结局发生概率之间的转换函数来计算每个患者的结局时间发生的概率。


读图


随遍找一篇文章的图作为示例。


Nomogram

image.png

Jin C, Cao J, Cai Y, et al. A nomogram for predicting the risk of invasive pulmonary adenocarcinoma for patients with solitary peripheral subsolid nodules. J Thorac Cardiovasc Surg. 2017;153(2):462-469.e1.


红色箭头为我手动标注。


列线图的名称主要包括三个部分:


预测模型中的变量名称


例如图中的vascular convergence signs,pleural tag,computed tomography等信息,每一个变量对应的线段上都标注了刻度,代表了该变量的可取值范围,而线段的长度则反映了该因素对结局事件的贡献大小。


得分


单项得分,即图中的Points,表示每个变量在不同取值下所对应的单项分数,


总得分,即Total Point,表示所有变量取值后对应的单项分数加起来合计的总得分。


预测概率


例如图中的Risk of invasive pulmonary adenocarcinoma,表示侵袭性肺腺癌的患病风险。


如何计算呢?


如红色箭头所示,找出该患者每个变量对应的单项得分。最后将所有变量的单项得分相加,得到患者的总得分,并以总得分为基础,再向下画一条垂直线,就可以知道该患者侵袭性肺腺癌的患病风险。

image.png

列线图的Calibration校准曲线


X轴表示诺模图预测的概率,y轴表示侵袭性腺癌的实际概率。完美的预测对应绿色虚线。红色虚线表示整个队列,蓝色实线通过Bootstrapping(1000次重复)进行偏差校正,表示观察到的诺模图性能。


分析并绘制

rm(list = ls())
library(survival)
library(survminer)
data(lung)
head(lung) #示例数据
## 添加变量标签
lung$sex <- factor(lung$sex,
         levels = c(1,2),
         labels = c("male", "female"))
head(lung)
## 根据nomogram要求处理数据
dd=datadist(lung)
options(datadist="dd")

Logisitc回归模型

## 构建模型
## 构建logisitc回归模型,以age、sex为因子
f1 <- lrm(status~ age + sex, data = lung) 
## 绘制logisitc回归的风险预测值的nomogram图
nom <- nomogram(f1, fun= function(x)1/(1+exp(-x)), # or fun=plogis
                lp=F, funlabel="Risk")
plot(nom)

image.png

logisitc回归模型nomogram


COX比例风险模型

f2 <- psm(Surv(time,status) ~ age+sex, data =  lung, dist='lognormal') 
med <- Quantile(f2) # 计算中位生存时间
surv <- Survival(f2) # 构建生存概率函数
## 绘制COX回归中位生存时间的Nomogram图
nom <- nomogram(f2, fun=function(x) med(lp=x),
                funlabel="Median Survival Time")
plot(nom)
## 绘制COX回归生存概率的Nomogram图
## 注意lung数据的time是以’天‘为单位
nom <- nomogram(f2, fun=list(function(x) surv(365, x),
                             function(x) surv(730, x)),
                funlabel=c("1-year Survival Probability",
                           "2-year Survival Probability"))
plot(nom, xfrac=.6)

image.png

COX比例风险模型nomogram

## 评价COX回归的预测效果
## 计算c-index
rcorrcens(Surv(time,status) ~ predict(f2), data =  lung)
Somers' Rank Correlation for Censored Data    Response variable:Surv(time, status)
                C   Dxy  aDxy    SD    Z     P   n
predict(f2) 0.601 0.203 0.203 0.051 3.98 1e-04 228

C-index,concordance index,一致性指数,主要用于计算生存分析中的COX模型预测值与真实之间的区分度,常用在评价患者预后模型的预测精度中。


C-index在0.5-1之间(任意配对随机情况下一致与不一致刚好是0.5的概率)。0.5为完全不一致,说明该模型没有预测作用,1为完全一致,说明该模型预测结果与实际完全一致。一般情况下C-index在0.50-0.70为准确度较低:在0.71-0.90之间为准确度中等;而高于0.90则为高准确度。


Calibration校准曲线

## 绘制校正曲线
## 重新调整模型函数f2,也即添加x=T, y=T
f2 <- psm(Surv(time,status) ~ age+sex, data =  lung, x=T, y=T, dist='lognormal') 
## 构建校正曲线
cal1 <- calibrate(f2, 
                  cmethod='KM', 
                  method="boot", 
                  u=365, # u需要与之前模型中定义好的time.inc一致,即365或730;
                  m=76, #每次抽样的样本量,
                  B=1000) #抽样次数
## m要根据样本量来确定,由于标准曲线一般将所有样本分为3组(在图中显示3个点)
## 绘制校正曲线
plot(cal1,lwd=2,lty=1,
     conf.int=T,# 是否显示置信区间
     errbar.col="blue",#直线曲线bar颜色
     col="red", # 曲线颜色
     xlim=c(0.25,0.6),ylim=c(0.15,0.70),
     xlab="Nomogram-Predicted Probability of 1-Year DFS",
     ylab="Actual 1-Year DFS (proportion)",
     subtitles = F)#不显示副标题

image.png

相关文章
R实战 | 对称云雨图 + 箱线图 + 配对散点 + 误差棒图 +均值连线
R实战 | 对称云雨图 + 箱线图 + 配对散点 + 误差棒图 +均值连线
1526 1
R实战 | 对称云雨图 + 箱线图 + 配对散点 + 误差棒图 +均值连线
|
4月前
|
数据可视化 数据挖掘 Python
绘制带误差分析的柱状图
【9月更文挑战第1天】在数据分析与科研中,带误差分析的柱状图能直观展示数据分布与不确定性。本文介绍使用Python的Matplotlib库和Excel绘制此类图表的方法,包括安装库、准备数据、绘制图表及添加误差线等步骤,帮助用户根据需求进行调整与定制。
|
8月前
|
数据可视化
R语言中绘制ROC曲线和PR曲线
R语言中绘制ROC曲线和PR曲线
|
8月前
|
数据可视化
绘制GGPLOT2双色XY区间面积图组合交叉折线图数据可视化
绘制GGPLOT2双色XY区间面积图组合交叉折线图数据可视化
|
机器学习/深度学习 算法 数据可视化
R绘图案例|基于分面的面积图绘制
R绘图案例|基于分面的面积图绘制
10875 0
|
数据可视化 数据挖掘 Python
跟着Nature学作图:R语言ggplot2柱形图添加误差线和频率分布直方图
跟着Nature学作图:R语言ggplot2柱形图添加误差线和频率分布直方图
|
数据可视化 数据挖掘 Python
跟着Nature学作图:R语言ggplot2频率分布直方图和散点图添加误差线
跟着Nature学作图:R语言ggplot2频率分布直方图和散点图添加误差线
|
数据可视化 数据格式
跟着 Cell 学作图 | 3.箱线图+散点+差异显著性检验
这篇2020年发表在cell上关于新冠的组学文章里面有大量的生信内容。今天带大家复现其中的一个Supplemental Figure:带散点的箱线图。
1597 1
跟着 Cell 学作图 | 3.箱线图+散点+差异显著性检验
111.绘制正态分布曲线
111.绘制正态分布曲线
124 0
144.绘制布朗运动曲线
144.绘制布朗运动曲线
114 0