开发者学堂课程【高校精品课-华东师范大学-人工智能基础:多元线性回归-预测电影票房】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/920/detail/15590
多元线性回归-预测电影票房
内容介绍:
一、多元线性回归
二、实验:多元线性回归预测电影票房
一、多元线性回归
上一次介绍了一元线性回归分析预测了大明电影公司的票房收入,有时电影的票房收入不仅仅与投资有关,还有其他因素。本次介绍多个因素下的预测问题即多元线性回归。
一元回归方程的形式是 Y=WX+B,如果输入的数据是多维的,为 y =W1X1+…+wnXn +b。
那么线性回归就是输入变量的线性组合,此时的回归方程就变成了 y =W1X1+…+wnXn +b。
其中 x 表示输入数据,w 是模型的参数。其中的XW为一组数据,也是一组向量。如果X只有一个数值,则线性回归为y=wx+b 称为一元线性回归。如果 x 为一组数据 x =(X1,....xn),则为多元线性回归。
一元线性回归方程比较容易求解,多元线性回归模型相当于多个未知数却给出了一个方程,其求解比较复杂。多元线性回归经常使用最小二乘算法逼近从而进行拟合。除了最小二乘法,也可以使用其他的数学方法进行拟合。
*最小二乘法:是一种数学优化方法,也称最小平方法。它通过最小化误差的平方和寻找最佳结果。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。
二、实验:多元线性回归预测电影票房
大明电影公司在运行过程发现,电影票房除了拍摄投资之外,还与广告推广的费用相关。于是在上面的数据基础上,又搜集到了每部电影的广告费用,整理成下面的表格。增加了 AD 广告费用。影响因素超过一个以后,可以使用多元回归方法。使用多元回归算法,预测投资1千万、广告推广费用3百万的电影的票房收入。
接下来完成数据的填空,regr 是 linerRegression 模型。
#训练数据
regr = linear_mode1.LinearRegression ()regr.fit(X,Y)
print(”系数(wl,w2)为:', regr.coef_)print(”截距(b)为:', regr.intercept)
#预测
y _predict = regr. predict(np.array([[10,3]]))
print('投资1千万,推广3百万的电影票房预测为: ', y_predict,'百万')
运行后的结果为
x:
[[ 6 1]
[ 9 3]
[12 2]
[14 3]
[16 4]]
Y: [ 9 12 29 35 59]
X 为投资额,Y 是电影票房
系数(w1,w2)为:[ 4.94890511 -0.70072993]
截距(b)为:-25.79562043795624
投资1千万,推广3百万的电影票房预测为:[21.59124088]百万
可以思考一下广告对电影票房的影响是怎么样的?在这个例子中,广告的系数是负的,针对特定的例子,增加广告费用没有增加投资的效果好。
本次介绍了多元性回归解决电影票房预测问题,一元线性回归和多元线性回归都还属于线性模型。