Py之scorecardpy:scorecardpy的简介、安装、使用方法之详细攻略

简介: Py之scorecardpy:scorecardpy的简介、安装、使用方法之详细攻略


目录

scorecardpy的简介

scorecardpy的安装

scorecardpy的使用方法

1、基础案例


scorecardpy的简介

      Scorecardpy,由谢士晨博士开发,这个包是 R 包评分卡的 python 版本。 其目标是通过为一些常见任务提供功能,使传统信用风险评分卡模型的开发更容易、更高效

  • 数据切分(split_df)
  • 变量选择(iv,var_filter)
  • 证据权重 (woe) 分箱(woebin、woebin_plot、woebin_adj、woebin_ply)
  • 评分卡缩放 (scorecard, scorecard_ply)
  • 性能评估(perf_eva、perf_psi)

Githubhttps://github.com/shichenxie/scorecardpy

案例

scorecardpy库的使用简介 - 知乎

评分卡建模工具scorecardpy全解读 - 知乎

scorecardpy的安装

pip install scorecardpy

 

scorecardpy的使用方法

1、基础案例

1. # Traditional Credit Scoring Using Logistic Regression
2. import scorecardpy as sc
3. 
4. # data prepare ------
5. # load germancredit data
6. dat = sc.germancredit()
7. 
8. # filter variable via missing rate, iv, identical value rate
9. dt_s = sc.var_filter(dat, y="creditability")
10. 
11. # breaking dt into train and test
12. train, test = sc.split_df(dt_s, 'creditability').values()
13. 
14. # woe binning ------
15. bins = sc.woebin(dt_s, y="creditability")
16. # sc.woebin_plot(bins)
17. 
18. # binning adjustment
19. # # adjust breaks interactively
20. # breaks_adj = sc.woebin_adj(dt_s, "creditability", bins) 
21. # # or specify breaks manually
22. breaks_adj = {
23. 'age.in.years': [26, 35, 40],
24. 'other.debtors.or.guarantors': ["none", "co-applicant%,%guarantor"]
25. }
26. bins_adj = sc.woebin(dt_s, y="creditability", breaks_list=breaks_adj)
27. 
28. # converting train and test into woe values
29. train_woe = sc.woebin_ply(train, bins_adj)
30. test_woe = sc.woebin_ply(test, bins_adj)
31. 
32. y_train = train_woe.loc[:,'creditability']
33. X_train = train_woe.loc[:,train_woe.columns != 'creditability']
34. y_test = test_woe.loc[:,'creditability']
35. X_test = test_woe.loc[:,train_woe.columns != 'creditability']
36. 
37. # logistic regression ------
38. from sklearn.linear_model import LogisticRegression
39. lr = LogisticRegression(penalty='l1', C=0.9, solver='saga', n_jobs=-1)
40. lr.fit(X_train, y_train)
41. # lr.coef_
42. # lr.intercept_
43. 
44. # predicted proability
45. train_pred = lr.predict_proba(X_train)[:,1]
46. test_pred = lr.predict_proba(X_test)[:,1]
47. 
48. # performance ks & roc ------
49. train_perf = sc.perf_eva(y_train, train_pred, title = "train")
50. test_perf = sc.perf_eva(y_test, test_pred, title = "test")
51. 
52. # score ------
53. card = sc.scorecard(bins_adj, lr, X_train.columns)
54. # credit score
55. train_score = sc.scorecard_ply(train, card, print_step=0)
56. test_score = sc.scorecard_ply(test, card, print_step=0)
57. 
58. # psi
59. sc.perf_psi(
60.   score = {'train':train_score, 'test':test_score},
61.   label = {'train':y_train, 'test':y_test}
62. )


相关文章
|
JavaScript 前端开发 数据可视化
Py之mpld3:mpld3的简介、安装、使用方法之详细攻略
Py之mpld3:mpld3的简介、安装、使用方法之详细攻略
Py之mpld3:mpld3的简介、安装、使用方法之详细攻略
|
机器学习/深度学习 Python
Py之yacs:yacs的简介、安装、使用方法之详细攻略
Py之yacs:yacs的简介、安装、使用方法之详细攻略
Py之yacs:yacs的简介、安装、使用方法之详细攻略
|
数据采集 算法 数据可视化
Py之Optbinning:Optbinning的简介、安装、使用方法之详细攻略
Py之Optbinning:Optbinning的简介、安装、使用方法之详细攻略
Py之Optbinning:Optbinning的简介、安装、使用方法之详细攻略
|
人工智能 并行计算 API
Py之cupy:cupy的简介、安装、使用方法之详细攻略
Py之cupy:cupy的简介、安装、使用方法之详细攻略
Py之cupy:cupy的简介、安装、使用方法之详细攻略
|
Linux Python Windows
Py之terminaltables:terminaltables的简介、安装、使用方法之详细攻略
Py之terminaltables:terminaltables的简介、安装、使用方法之详细攻略
Py之terminaltables:terminaltables的简介、安装、使用方法之详细攻略
|
JavaScript 前端开发 Python
Py之easydict:easydict的简介、安装、使用方法之详细攻略
Py之easydict:easydict的简介、安装、使用方法之详细攻略
Py之easydict:easydict的简介、安装、使用方法之详细攻略
|
Unix Linux API
Py之portalocker:portalocker的简介、安装、使用方法之详细攻略
Py之portalocker:portalocker的简介、安装、使用方法之详细攻略
Py之portalocker:portalocker的简介、安装、使用方法之详细攻略
|
存储 程序员 Python
Py之configobj:configobj的简介、安装、使用方法之详细攻略
Py之configobj:configobj的简介、安装、使用方法之详细攻略
Py之configobj:configobj的简介、安装、使用方法之详细攻略
|
JSON 数据格式 Python
Py之simplejson:simplejson库的简介、安装、使用方法之详细攻略
Py之simplejson:simplejson库的简介、安装、使用方法之详细攻略
Py之simplejson:simplejson库的简介、安装、使用方法之详细攻略
Py之cvxopt:cvxopt库的简介、安装、使用方法之详细攻略
Py之cvxopt:cvxopt库的简介、安装、使用方法之详细攻略
Py之cvxopt:cvxopt库的简介、安装、使用方法之详细攻略