回归分析是确定变量间依赖关系的一种统计分析方法,属于监督学习方法。由变量的不同可以分为一元线性回归和多元线性回归
接下来以多元线性回归为例介绍
当待确定的变量超过一个时,就需要使用多元线性回归算法,下面介绍多变量问题中的多元线性回归分析
数据如下 总共有14个变量 我们需要挨个分析其中一个变量与其他十三个变量之间的依赖关系
程序输出结果如下
其中括号里是其他十三个变量与预测变量这件的关系因子 下面的是截距
下面的是一些参数和误差因子
代码如下 只需根据自己的模型替换数据及预测变量即可
import pandas as pd from sklearn.linear_model import LinearRegression from matplotlib import pyplot as plt import numpy as np import matplotlib; matplotlib.use('TkAgg') np.set_printoptions(suppress=True) # 取消科学计数法输出 df = pd.read_csv(r"铅钡未风化数据.csv") #df1=df['类型'] #print(df1) #剩下的依次交换预测对象 即可 代码在此不冗余 X = df[[ 'Na2O', 'K2O', 'CaO', 'MgO','Al2O3','Fe2O3','CuO','PbO','BaO','P2O5','SrO','SnO2','SO2']] Y = df['SiO2'] model = LinearRegression() model.fit(X, Y) print("预测结果--------",) print(model.coef_) print(model.intercept_) import statsmodels.api as sm X2 = sm.add_constant(X) est = sm.OLS(Y,X2).fit() print(est.summary())