根据生存曲线的估计,可以推断出相比组之间存活时间的差异,因此生存曲线非常有用,几乎可以在每个生存分析中看到。
例
在我们将对象放入ggsurvplot()
函数之后,我们可以创建简单的生存曲线估计。让我们来看看患有卵巢癌(卵巢浆液性囊腺癌)和患有乳腺癌(乳腺浸润癌)的患者之间存活时间的差异 。
survivalTCGA(BRCA.clinical, OV.clinical, extract.cols = "admin.disease_code") -> BRCAOV.survInfo library(survival) fit <- survfit(Surv(times, patient.vital_status) ~ admin.disease_code, data = BRCAOV.survInfo) # 可视化 ggsurvplot(fit, data = BRCAOV.survInfo, risk.table = TRUE)
这个简单的图表以优雅的方式呈现了生存概率的估计值,该估计值取决于根据癌症类型分组的癌症诊断天数和信息风险集表,其中显示了在特定时间段内观察的患者数量。生存分析是一个特定的数据分析领域,因为事件数据的审查时间,因此风险集大小是视觉推理的必要条件。
ggsurvplot( fit, # survfit 变量 data = BRCAOV.survInfo, # 拟合数据 risk.table = TRUE, # 显示 risk table. pval = TRUE, # 时序检验(logrank test)p-value . conf.int = TRUE, # 曲线的置信区间. xlim = c(0,2000), # 横轴范围 break.time.by = 500, # 时间刻度. ggtheme = theme_minimal(), # 画图主题 risk.table.y.text.col = T, # 文字颜色 risk.table.y.text = FALSE # 用条形图代替文字标注 )
每个参数都在相应的注释中描述,但我想强调xlim
控制X轴限制但不影响生存曲线的参数,这些参数考虑了所有可能的时间。
比较
基础包
看起来很漂亮.....