多元线性回归-预测电影票房|学习笔记

简介: 快速学习多元线性回归-预测电影票房

开发者学堂课程【高校精品课-华东师范大学-人工智能基础:多元线性回归-预测电影票房】学习笔记,与课程紧密联系,让用户快速学习知识。

课程地址:https://developer.aliyun.com/learning/course/920/detail/15590


多元线性回归-预测电影票房

 

内容介绍:

一、多元线性回归

二、实验:多元线性回归预测电影票房

 

一、多元线性回归

上一介绍了一元线性回归分析预测了大明电影公司的票房收入,有时电影的票房收入不仅仅与投资有关,还有其他因素本次介绍多个因素下的预测问题多元线性回归

一元回归方程的形式是 Y=WX+B,如果输入的数据是多维的为 y =W1X1+…+wnXn +b。

那么线性回归就是输入变量的线性组合,此时的回归方程就变成了 y =W1X1+…+wnXn +b。

其中 x 表示输入数据,w 是模型的参数。其中的XW为一组数据,也是一组向量。如果X只有一个数值,则线性回归为y=wx+b 称为一元线性回归。如果 x 为一组数据 x =(X1,....xn),则为多元线性回归。

一元线性回归方程比较容易求解,多元线性回归模型相当于多个未知数却给出了一个方程,其求解比较复杂。多元线性回归经常使用最小二乘算法逼近从而进行拟合。除了最小二乘法,也可以使用其他的数学方法进行拟合。

*最小二乘法:是一种数学优化方法,也称最小平方法。它通过最小化误差的平方和寻找最佳结果。利用最小二乘法可以简便地求得未知的数据,并使得这些求得的数据与实际数据之间误差的平方和为最小。

 

二、实验:多元线性回归预测电影票房

大明电影公司在运行过程发现,电影票房除了拍摄投资之外,还与广告推广的费用相关。于是在上面的数据基础上,又搜集到了每部电影的广告费用,整理成下面的表格。增加了 AD 广告费用。影响因素超过一个以后,可以使用多元回归方法。使用多元回归算法,预测投资1千万、广告推广费用3百万的电影的票房收入。

 image.png

接下来完成数据的填空,regr 是 linerRegression 模型。

#训练数据

regr = linear_mode1.LinearRegression ()regr.fit(X,Y)

print(”系数(wl,w2)为:', regr.coef_)print(”截距(b)为:', regr.intercept)

#预测

y _predict = regr. predict(np.array([[10,3]]))

print('投资1千万,推广3百万的电影票房预测为: ', y_predict,'百万')

运行后的结果为

x:

[[ 6  1]

[ 9  3]

[12  2]

[14  3]

[16  4]]

Y: [ 9 12 29 35 59]

X 为投资额,Y 是电影票房

系数(w1,w2)为:[ 4.94890511 -0.70072993]

截距(b)为:-25.79562043795624

投资1千万,推广3百万的电影票房预测为:[21.59124088]百万

可以思考一下广告对电影票房的影响是怎么样的?在这个例子中,广告的系数是负的,针对特定的例子,增加广告费用没有增加投资的效果好

本次介绍了多元性回归解决电影票房预测问题一元线性回归和多元线性回归都还属于线性模型

相关文章
|
27天前
|
机器学习/深度学习 人工智能 算法
机器学习-线性模型(波士顿房价预测)
机器学习-线性模型(波士顿房价预测)
|
27天前
|
算法 Python
线性回归-最小二乘法入门(波士顿房价)
线性回归-最小二乘法入门(波士顿房价)
19 0
|
12天前
|
机器学习/深度学习 自然语言处理 算法
【视频】K近邻KNN算法原理与R语言结合新冠疫情对股票价格预测|数据分享(下)
【视频】K近邻KNN算法原理与R语言结合新冠疫情对股票价格预测|数据分享
|
20天前
|
存储 数据可视化 数据库
R语言泊松Poisson回归模型预测人口死亡率和期望寿命
R语言泊松Poisson回归模型预测人口死亡率和期望寿命
|
20天前
|
机器学习/深度学习
R语言用线性回归模型预测空气质量臭氧数据
R语言用线性回归模型预测空气质量臭氧数据
|
19天前
|
机器学习/深度学习 算法 大数据
结合新冠疫情COVID-19股票价格预测:ARIMA,KNN和神经网络时间序列分析
结合新冠疫情COVID-19股票价格预测:ARIMA,KNN和神经网络时间序列分析
|
20天前
|
vr&ar
R语言用ARIMA模型预测巧克力的兴趣趋势时间序列
R语言用ARIMA模型预测巧克力的兴趣趋势时间序列
|
19天前
|
机器学习/深度学习 自然语言处理 算法
R语言结合新冠疫情COVID-19股票价格预测:ARIMA,KNN和神经网络时间序列分析
R语言结合新冠疫情COVID-19股票价格预测:ARIMA,KNN和神经网络时间序列分析
|
19天前
R语言样条曲线、泊松回归模型估计女性直肠癌患者标准化发病率(SIR)、死亡率(SMR)
R语言样条曲线、泊松回归模型估计女性直肠癌患者标准化发病率(SIR)、死亡率(SMR)
|
19天前
R语言贝叶斯Poisson泊松-正态分布模型分析职业足球比赛进球数
R语言贝叶斯Poisson泊松-正态分布模型分析职业足球比赛进球数