Py之scikiti -survival:scikiti -survival库的简介、安装、使用方法之详细攻略

简介: Py之scikiti -survival:scikiti -survival库的简介、安装、使用方法之详细攻略

 

目录

scikiti -survival库的简介

Requirements

scikiti -survival库的安装

scikiti -survival库的使用方法

1、退伍军人管理局肺癌试验


 

 

scikiti -survival库的简介

        scikiti -survival是一个建立在scikiti -learn之上的用于生存分析的Python模块。它可以利用scikit-learn的力量进行生存分析,例如进行预处理或交叉验证。

        scikiti -survival(也称为事件发生时间或可靠性分析)的目的是建立协变量和事件发生时间之间的联系。生存分析与传统机器学习的不同之处在于,部分训练数据只能被部分观察到——它们被审查了。例如,在临床研究中,患者通常在一个特定的时间段内被监测,并记录在这个时间段内发生的事件。如果一个病人经历了一个事件,事件的确切时间可以被记录-病人的记录是不被审查的。与此相反,正确删除的记录指的是在研究期间没有发生事件的患者,并且不知道在研究结束后是否发生了事件。因此,生存分析要求模型考虑到这种数据集的独特特征。

 

Requirements

  • Python 3.5 or later
  • cvxpy
  • cvxopt
  • joblib
  • numexpr
  • numpy 1.12 or later
  • osqp
  • pandas 0.21 or later
  • scikit-learn 0.22 or 0.23
  • scipy 1.0 or later
  • C/C++ compiler

 

 

scikiti -survival库的安装

pip install scikit-survival

pip install -i https://pypi.tuna.tsinghua.edu.cn/simple scikit-survival

conda install -c sebp scikit-survival

 

 

 

 

 

scikiti -survival库的使用方法

1、退伍军人管理局肺癌试验

1. from sksurv.datasets import load_veterans_lung_cancer
2. 
3. data_x, data_y = load_veterans_lung_cancer()
4. data_y
5. 
6. import pandas as pd
7. pd.DataFrame.from_records(data_y[[11, 5, 32, 13, 23]], index=range(1, 6))
8. 
9. 
10. import matplotlib.pyplot as plt
11. from sksurv.nonparametric import kaplan_meier_estimator
12. 
13. time, survival_prob = kaplan_meier_estimator(data_y["Status"], data_y["Survival_in_days"])
14. plt.step(time, survival_prob, where="post")
15. plt.ylabel("est. probability of survival $\hat{S}(t)$")
16. plt.xlabel("time $t$")
17. 
18. 
19. print(data_x["Treatment"].value_counts())
20. 
21. for treatment_type in ("standard", "test"):
22.     mask_treat = data_x["Treatment"] == treatment_type
23.     time_treatment, survival_prob_treatment = kaplan_meier_estimator(
24.         data_y["Status"][mask_treat],
25.         data_y["Survival_in_days"][mask_treat])
26. 
27.     plt.step(time_treatment, survival_prob_treatment, where="post",
28.              label="Treatment = %s" % treatment_type)
29. 
30. plt.ylabel("est. probability of survival $\hat{S}(t)$")
31. plt.xlabel("time $t$")
32. plt.legend(loc="best")
33. 
34. 
35. for value in data_x["Celltype"].unique():
36.     mask = data_x["Celltype"] == value
37.     time_cell, survival_prob_cell = kaplan_meier_estimator(data_y["Status"][mask],
38.                                                            data_y["Survival_in_days"][mask])
39.     plt.step(time_cell, survival_prob_cell, where="post",
40.              label="%s (n = %d)" % (value, mask.sum()))
41. 
42. plt.ylabel("est. probability of survival $\hat{S}(t)$")
43. plt.xlabel("time $t$")
44. plt.legend(loc="best")

 


相关文章
|
JavaScript 前端开发 数据可视化
Py之mpld3:mpld3的简介、安装、使用方法之详细攻略
Py之mpld3:mpld3的简介、安装、使用方法之详细攻略
Py之mpld3:mpld3的简介、安装、使用方法之详细攻略
|
机器学习/深度学习 Python
Py之lime:lime库的简介、安装、使用方法之详细攻略
Py之lime:lime库的简介、安装、使用方法之详细攻略
Py之lime:lime库的简介、安装、使用方法之详细攻略
|
JSON 数据格式 Python
Py之simplejson:simplejson库的简介、安装、使用方法之详细攻略
Py之simplejson:simplejson库的简介、安装、使用方法之详细攻略
Py之simplejson:simplejson库的简介、安装、使用方法之详细攻略
|
人工智能 PyTorch 测试技术
Py之fvcore:fvcore库的简介、安装、使用方法之详细攻略
Py之fvcore:fvcore库的简介、安装、使用方法之详细攻略
Py之fvcore:fvcore库的简介、安装、使用方法之详细攻略
Py之cvxopt:cvxopt库的简介、安装、使用方法之详细攻略
Py之cvxopt:cvxopt库的简介、安装、使用方法之详细攻略
Py之cvxopt:cvxopt库的简介、安装、使用方法之详细攻略
|
人工智能 并行计算 API
Py之cupy:cupy的简介、安装、使用方法之详细攻略
Py之cupy:cupy的简介、安装、使用方法之详细攻略
Py之cupy:cupy的简介、安装、使用方法之详细攻略
|
数据采集 算法 数据可视化
Py之Optbinning:Optbinning的简介、安装、使用方法之详细攻略
Py之Optbinning:Optbinning的简介、安装、使用方法之详细攻略
Py之Optbinning:Optbinning的简介、安装、使用方法之详细攻略
|
Unix Linux API
Py之portalocker:portalocker的简介、安装、使用方法之详细攻略
Py之portalocker:portalocker的简介、安装、使用方法之详细攻略
Py之portalocker:portalocker的简介、安装、使用方法之详细攻略
Py之scorecardpy:scorecardpy的简介、安装、使用方法之详细攻略
Py之scorecardpy:scorecardpy的简介、安装、使用方法之详细攻略
Py之scorecardpy:scorecardpy的简介、安装、使用方法之详细攻略
|
JavaScript 前端开发 Python
Py之easydict:easydict的简介、安装、使用方法之详细攻略
Py之easydict:easydict的简介、安装、使用方法之详细攻略
Py之easydict:easydict的简介、安装、使用方法之详细攻略