开发者学堂课程【机器学习算法 :模型应用】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/535/detail/7196
模型应用
内容介绍
一、预测
二、控制
一、 预测
单值预测:(这个最简单、最常用,给一个自变量后根据公式求因变量, 都是已知的,可以直接计算)
根据自变量和回归方程预测因变量的单个值:
区间预测:使用回归方程预测值和真实值有一定的差值,要在一定自信度的情况下,需要预测一些区间。举例,已知父亲的身高来预测孩子的身高,父亲为一米八预测孩子,可能是一个单值预测预测出即可。要想得到更多的信息,比如希望有百分之九十的可能,在一定的区间内,已经知道了父亲的身高预测孩子的身高,这个值肯定是一个波动的值,是在一定的范围内。保证孩子有多大的可能性出现在这个范围。假设范围是95%,这样的数值。
思路:显著水平α,找到区间(),使得某特定的实际值。以1-α的概率在该区间内,即:P()= 1-α
因变量新值的区间预测
预测因变量在某个置信度的取值区间
因变量新值的均值区间预测
预测因变量的均值在某个置信度的取值区间
新值区间预测
思路:显著水平α,找到区间(),使得某特定的实际值。以1-α的概率在该区间内,即:P()= 1-α
正态假定下有:~N(),其中,这是固定的模式。
与独立,有:
因为E()=E(y),所以有:,均值是0,方差就是
构造 t 统计量 ,可得:
求得的置信概率为的置信区间为:
当样本量 n 较大,||较小时,接近与0,的置信度为95%的置信区间近似为:
新值的均值区间预测
思路:显著水平 α,找到区间(),使得某特定的实际值。以1-α的概率在该区间内,即:
正态假定下有:,其中
因为E(y)=是常数,所以有:
求得的置信概率为的置信区间为:
二、 控制
控制是预测的反问题。要把因变量 y 控制在一定范围内取值,需要控制 x 的值才能以 1-α 的概率把目标值 y 控制在()中,即:P()=1-α,其中 α 是实现给定的(0,1)之间的小数,用来确定置信度。
以 α=0.05 为例,则95%置信度的置信区间约为(y-26,y+2分),即有:
当时,
当时,
预测与控制的例子
已知两组数据 x、y,使用一元线性回归模型拟合两者之间的关系: y=10.278+4.919x。对于新值进行预测:x=5,求 y=?,y 的9(5%置信区间?如果想 让 y 在95%置信度下取值在(30,40),该如何控制x?
单值预测: y=10.278+4.919x=34.873
新值区间预测:=>34.873+-2.16*1.699=>y(31.203,38.543)
控制:,有:。