导语:
之前有做过一些简单的跟机器学习相关的一些小玩意,比如OCR识别,车牌识别的东西,不过没有系统话的学习过机器学习,最近打算系统的看看学一学。这个是看吴恩达的机器学习的学习笔记的记录。
学习地址
什么是机器学习 Machine Learning:
视频中介绍了两位机器学习专家给出的机器学习的定义:
1.Artthur Samuel(1959年).Machine Learning:Field of study that give computers the ability to
learn without being explicitly programmed.
在某个领域,使计算机无需明确编程即可学会某项技能。
2.Tom Mitchell(1998).Well-posed Learning Problem:A computer program is said to learn from experience E with respect
to some task T and some performance measure P, if its performance on T, as measured by P, improves with experience E.
适定的学习问题:如果某计算机程序在T上的性能(由P衡量)随经验E的提高而提高,则该计算机程序可以从经验E中学习一些任务T和一些绩效指标P。
ps:感觉这两个说法虽然看起来不同,但是确实在说同一件事件。第二个说法更加具体,我自己的理解就是让计算机经过训练,能完成某种特定场景的任务。
监督学习 Supervised Learning:
In supervised learning, we are given a data set and already know what our correct output
should look like, having the idea that there is a relationship between the input an d the output.
Supervised learning problems are categorized into "regression" and "classification" problems.
In a regression problem, we are trying to predict results within a continuous output, meaning
that we are trying to map input variables to some cont inuous function. In a classification
problem, we are instead trying to predict results in a discrete output. In other words, we are
trying to map input variables into discrete categories.
在监督学习中,我们得到了一个数据集,并且已经知道我们的正确输出应该是什么样子,并认为输入与输出之间存在关系。监督学习问题分为“回归”和“分类”问题。在回归问题中,我们试图预测连续输出中的结果,这意味着我们试图将输入变量映射到某些连续函数。在分类问题中,我们改为尝试预测离散输出中的结果。换句话说,我们正在尝试将输入变量映射为离散类别。
ps:文中用预测房价的走向举了一个例子,还是比较好理解的,相当于某些事情是有一个内在的规律,比如房价预测就是一个一元二次的方程,x是房屋面积,y是价格,然后通过不断的输入
数据来找寻这个x的系数和指数是多少,完成这个公式之后就可以用这个公式去预测其他面积x对应的房价是多少。之所以被称为监督学习,是人要给计算器提供正确的答案,引导计算机往人类想要的结果的方向去学习。
无监督学习 Unsupervised Learning:
Unsupervised learning allows us to approach problems with little or no idea what our results
should look like. We can derive structure from data where we don't necessarily know the
effect of the variables.
We can derive this structure by clustering the data based on relationships among the variables
in the data.
With unsupervised learning there is no feedback based on the prediction results.
无监督学习使我们几乎或根本不了解结果应该是什么样的情况下解决问题。我们可以从不必知道变量影响的数据中得出结构。我们可以通过基于数据中变量之间的关系对数据进行聚类来推导此结构。在无监督学习的情况下,没有基于预测结果的反馈。
ps:无监督学习纯属计算机自己去学习的一个过程,人类不用给出正确或错误的答案,程序自动分析数据的相同和不同点做分类,把它们区分开来,比较常用的就有聚类算法。
总结:
吴恩达的教程是英文的但是有双语字幕,并不是很难懂,还有PPT可以下载,应该对像我这样的初学者还是很友好的。结合着周志华的西瓜书对照着看下还是很有帮助的。希望后面把这个专题学完写完能对人工智能有个新的认识也能写点小项目。
中美未来这些年肯定是要相互竞争的,美国希望中国放弃高科技产业,包括人工智能,这反而激起了想学习人工智能的热情,虽然本质工作不是干这个的,不过多学学总有好处。