我有数据集 X_train, X_test, y_train, y_test = train_test_split(X,y, random_state =34) 我已经构建了我的模式并获得了预测 mdl.fit(X_train, y_train) y_pred = mdl.predict(X_test) 现在我想单独看一下预测值和y_test值 我这样做了 pd.DataFrame(y_pred).join(y_test) 但结果是NaN大多数值
0 AdmAfter12Mths
0 1.113033e+00 NaN 1 1.794673e+00 NaN 2 -1.279929e-01 NaN 3 8.467617e-01 NaN 4 1.315781e+00 NaN 5 5.421329e-01 NaN 6 1.203635e-01 NaN 7 9.216141e+00 NaN 8 1.248840e+01 NaN 9 1.027268e+00 7.0 10 3.767157e-02 NaN 我尝试了另一种方式
pd.concat([y_test, pd.DataFrame(y_pred)], axis=1) 相同的结果
0 AdmAfter12Mths
0 1.113033 NaN 1 1.794673 NaN 2 -0.127993 NaN 3 0.846762 NaN 4 1.315781 NaN 5 0.542133 NaN 6 0.120363 NaN 7 9.216141 NaN 8 12.488396 NaN 9 1.027268 7.0 10 0.037672 NaN 我意识到数据帧索引可能是问题所在,但, 我怎样才能把两者y_pred并y_test在同一个数据帧
添加 reset_index()
pd.concat([y_test.reset_index(drop=True), pd.DataFrame(y_pred)], axis=1)
版权声明:本文内容由阿里云实名注册用户自发贡献,版权归原作者所有,阿里云开发者社区不拥有其著作权,亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容,填写侵权投诉表单进行举报,一经查实,本社区将立刻删除涉嫌侵权内容。