autoReg | 自动线性和逻辑回归和生存分析

简介: autoReg | 自动线性和逻辑回归和生存分析

autoReg | 自动线性和逻辑回归和生存分析


autoReg可以制作描述性统计汇总表,在各种回归模型中自动选择解释变量。支持线性模型、广义线性模型和环比例风险模型。生成可发表的回归分析结果汇总表和图表。


#install.packages("devtools")
devtools::install_github("cardiomoon/autoReg")
library(autoReg)

基线特征描述统计

## 基线特征描述统计
library(moonBook) # 示例数据
data(acs)
library(dplyr)
ft=gaze(sex~.,data=acs) %>% myft()
ft
# library(rrtable)
# table2pptx(ft) #Exported table as Report.pptx
# table2docx(ft) #Exported table as Report.docx

image.png

用两个或多个分组变量总结基线特征

gaze(sex+Dx~.,data=acs) %>% myft()
gaze(sex+DM+HBP~age,data=acs) %>% myft()

自动选择解释变量

可以做一个表格总结回归分析的结果。例如,对结肠癌数据进行逻辑回归分析。

library(survival)   # For use of data colon
data(cancer)  
fit=glm(status~rx+sex+age+obstruct+perfor+nodes,data=colon,family="binomial")
summary(fit)
autoReg(fit) %>% myft()

image.png

如果想要一个有更多解释的表,你可以用数字变量来做分类变量。

colon$status.factor=factor(colon$status,labels=c("Alive","Died"))
colon$obstruct.factor=factor(colon$obstruct,labels=c("No","Yes"))
colon$perfor.factor=factor(colon$perfor,labels=c("No","Yes"))
colon$sex.factor=factor(colon$sex,labels=c("Female","Male"))
fit=glm(status.factor~rx+sex.factor+age+obstruct.factor+perfor.factor+nodes,data=colon,family="binomial")
result=autoReg(fit) 
result %>% myft()
## setLabel()函数给变量名添加标签
colon$status.factor=setLabel(colon$status.factor,"Mortality")
colon$rx=setLabel(colon$rx,"Treatment")
colon$age=setLabel(colon$age,"Age(Years)")
colon$sex.factor=setLabel(colon$sex.factor,"Sex")
colon$obstruct.factor=setLabel(colon$obstruct.factor,"Obstruction")
colon$perfor.factor=setLabel(colon$perfor.factor,"Perforation")
colon$nodes=setLabel(colon$nodes,"Positive nodes")
fit=glm(status.factor~rx+sex.factor+age+obstruct.factor+perfor.factor+nodes,data=colon,family="binomial")
result=autoReg(fit) 
result %>% myft()

image.png

# 如果不想在表中显示参考值,可以缩短表。
shorten(result) %>% myft()

image.png


添加单变量模型表和自动选择解释变量

可以将单变量分析的结果添加到表中。此时,autoReg()函数自动选择阈值(默认值0.2)以下的解释变量,并执行多变量分析。在本表中,解释变量的p值为性别。因子和年龄均高于缺省阈值(0.2),在多元模型中被排除。


autoReg(fit, uni=TRUE) %>% myft()

网络异常,图片无法展示
|

如果想在多元模型中包含所有解释变量,只需将阈值设置为1。


autoReg(fit, uni=TRUE,threshold=1) %>% myft()

image.png

可以通过逐步的向后消除来选择变量并做出最终的模型。


autoReg(fit, uni=TRUE,threshold=1, final=TRUE) %>% myft()

image.png

在图表中总结回归模型的结果

x=modelPlot(fit)
x
# plot2pptx(print(x)) ##Exported plot as Report.pptx
modelPlot(fit,uni=TRUE,threshold=1,show.ref=FALSE)

image.png

参考

GitHub - cardiomoon/autoReg: R package autoReg


相关文章
|
6天前
|
机器学习/深度学习 算法 数据可视化
时间序列预测的不确定性区间估计:基于EnbPI的方法与应用研究
本文探讨了时间序列预测中不确定性量化的问题,特别是基于一致性预测理论的EnbPI方法。EnbPI通过集成学习和自举采样技术,解决了传统方法在处理非平稳时间序列数据时的局限性,提供了一种分布无关的预测区间构建方法,支持任意估计器的集成,并在推理阶段保持高效。实验结果显示,EnbPI在德国电力价格预测中表现出良好的覆盖率和适应性,尽管存在一定的计算成本。
27 0
|
7月前
|
存储 数据采集 数据可视化
R语言拟合线性混合效应模型、固定效应随机效应参数估计可视化生物生长、发育、繁殖影响因素
R语言拟合线性混合效应模型、固定效应随机效应参数估计可视化生物生长、发育、繁殖影响因素
|
7月前
|
算法 vr&ar Python
R语言隐马尔可夫模型HMM连续序列重要性重抽样CSIR估计随机波动率模型SV分析股票收益率时间序列
R语言隐马尔可夫模型HMM连续序列重要性重抽样CSIR估计随机波动率模型SV分析股票收益率时间序列
|
7月前
|
机器学习/深度学习 数据可视化
数据分享|R语言生存分析模型因果分析:非参数估计、IP加权风险模型、结构嵌套加速失效(AFT)模型分析流行病学随访研究数据
数据分享|R语言生存分析模型因果分析:非参数估计、IP加权风险模型、结构嵌套加速失效(AFT)模型分析流行病学随访研究数据
|
7月前
R语言中固定与随机效应Meta分析 - 效率和置信区间覆盖
R语言中固定与随机效应Meta分析 - 效率和置信区间覆盖
|
7月前
|
Python 数据可视化 索引
PYTHON用GARCH、离散随机波动率模型DSV模拟估计股票收益时间序列与蒙特卡洛可视化
PYTHON用GARCH、离散随机波动率模型DSV模拟估计股票收益时间序列与蒙特卡洛可视化
PYTHON用GARCH、离散随机波动率模型DSV模拟估计股票收益时间序列与蒙特卡洛可视化
|
7月前
|
Windows
R语言有状态依赖强度的非线性、多变量跳跃扩散过程模型似然推断分析股票价格波动
R语言有状态依赖强度的非线性、多变量跳跃扩散过程模型似然推断分析股票价格波动
|
7月前
|
定位技术 计算机视觉 Windows
生态学建模:增强回归树(BRT)预测短鳍鳗生存分布和影响因素
生态学建模:增强回归树(BRT)预测短鳍鳗生存分布和影响因素
|
7月前
|
算法 测试技术 vr&ar
用综合信息准则比较随机波动率(SV)模型对股票价格时间序列建模
用综合信息准则比较随机波动率(SV)模型对股票价格时间序列建模
|
7月前
如何在生存分析与Cox回归中计算IDI,NRI指标
如何在生存分析与Cox回归中计算IDI,NRI指标