开发者学堂课程【高校精品课-华东师范大学-人工智能基础:回归算法】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/920/detail/15587
回归算法
内容介绍:
一、人物介绍
二、回顾现象
三、回归分析(regression analysis)
一、人物介绍
弗朗西斯·高尔顿,弗朗西斯·高尔顿是达尔文的表弟,比他13岁。高尔顿小时候是一个神童,两岁开始就开始学习阅读,八岁就会解二次方程。
高尔顿拜读了达尔文表哥的物种起源之后热情高涨,开始研究遗传学。高尔顿忠于测量变异特征与遗传的关系,它对植物特征例如豌豆尺寸的遗传规律进行了研究。
他在研究人类遗传过程中统计了1453年到1853年间605位名人,发现其中有102位就有亲属关系,这意味着每6位成功人士中就有一位与其他存在亲属关系。
高尔顿预计如果某位成功人士有了后代,那么孩子出类拔萃的概率为1/12。与此相反这个概率在随机选择的普通人中是1/3000。他懂得调查结果也显示如果父母均是身材高大,那么孩子的个头也不会矮。
二、回顾现象
高尔顿使用豌豆实验来确定尺寸的遗传规律。通过把原始的豌豆种子(父代与新长的豌豆种子(子代)进行比较,发现豌豆在尺寸上具有一定的遗传规律。
高尔顿进一步研究人类的身高,发现父辈与子代的身高也具有一定的对应关系和倾向性。这一现象被命名为回归现象。
他通过进一步的研究发现,事实上孩子的平均身高是其父辈平均身高以及他们族群的平均身高的加权平均和,他在1886年发表了一篇论文,题目为 regression towards...描述了这种现象,把它称为均值回归或者平庸回归现象。
后来英国的统计学家尤立,在高尔顿的基础上改进了回归模型思想,在建立模型时加入了尽可能多的控制变量。
三、回归分析(regression analysis)
回归分析是确定两种或两种以上变量间相互依赖的定量关系的一种统计分析方法,回归分析主要用于预测,包括线性回归、逻辑回归、多项式回归、岭回归。
回归方法有很多种,按照变量的个数可以分成一元回归和多元回归分析,按照自变量和因变量之间的关系,可以分为线性回归和非线性回归等。在机器学习中,回归分析经常做一种预测模型,例如预测出行日期和机票价格之间的关系以及股票市场价格等。
以上介绍了回归的概念和它的起源,在实际应用中有各种各样的回归技术用于预测。