- cut() 函数
按照指定的边界值对变量进行分割
# 使用bins参数, 指定每个分组的边界 d_cut_bins = d.copy() d_cut_bins['cut_group'] = pd.cut(d_cut_bins['number'], bins=[0, 10, 50, 100]) d_cut_bins
继续信用评分系统 分箱代码分析
dfX = X.rank(method="first")
cutPd = pd.qcut(dfX, n) n=10 对dfX 分10组 每组的数量大小一致
d1 = pd.DataFrame({"X": X, "Y": Y, "Bucket": cutPd})
d2 = d1.groupby("Bucket", as_index = True)