开发者学堂课程【机器学习入门-概念原理及常用算法:机器学习基础概念】学习笔记,与课程紧密联系,让用户快速学习知识。
课程地址:https://developer.aliyun.com/learning/course/355/detail/4180
机器学习基础概念
内容介绍:
一、人工智能、机器学习、深度学习
二、什么是人工智能
三、什么是机器学习
四、举例
一、人工智能、机器学习、深度学习
人工智能从1950年兴起,1980年机器学习开始繁荣,2010年深度学习黑科技开始兴起,人工智能包含机器学习,机器学习包含深度学习,互相包含的关系。
二、什么是人工智能
Some classic definitions, building computers that...
①Think like humans
cognitive science/ neuroscience
e.g., General Problem Solver(Newell and Simon, 1961)
②Think rationally
logic and automated reasoning
but, not all problems can be solved just by reasoning
③Act like humans
Turing Test
④Act rationally
basis for intelligent agent framework
unclear if this captures the current scope of AI research
经典的定义希望它能够像人一样思考,做事情,甚至是像人一样去推理,做一些更智能的事情,图灵测试,认知科学,老科学等。
Its goal is to enable the development of computers that are able to do things normally done by people— in particular, things associated with people acting intelligently
如上图所示,几个常用的领域,有推理,机器人,机器学习,知识,数据挖掘,自然语言处理,视觉领域,这样区分不是指这几个有严格的界限,只是非常粗糙的区别,人工智能的目标使得有这样的计算机像人一样智能的去做一些事情,总体的目标。
从实用主义的角度来看,跟学习相关,跟搜索,编程,planning,模型,社交,信息分类等,在背后指的都是机器学习。
Fun time
Which of the following field cannot use artificial intelligence?
A. Finance
B. E-commerce
C. Law
D. None of the above
abc三个领域都可以用人工智能的知识。
三、什么是机器学习
1、Definition: computational methods using experience to improve performance
2、Experience:data-driven task, thus statistics, probability, and optimization
3、Computer science: learning algorithms, analysis of complexity theoretical guarantees
4、Example: use document word counts to predict its topic
定义其实就是一类的计算方法,通过使用经验去改进性能,它经验主要是数据驱动的一些经验,通过从数据里面得到这些经验,跟数据相关的无非就是这样几个学科,一个是统计概率,还有优化理论通过这样几个理论结合数据让机器去学习,同时跟经验相关的还有包括计算机科学里面相关的,比如优化理论里面很多一个具体学习的算法,有这些算法就会有复杂度的分析,这个是跟计算机学科息息相关的。比如使用一个文档里面它的词的一个视频的技术去预测它大概是属于什么样的一个 topic ,比如一篇文章它到底是属于科技类的,娱乐类的还是别的一个类型的。
(1)Machine Learning is a way of getting computers to come up with their own logic...
To solve problems based on examples that we provide
机器学习被认为是一种方式,这种方式使得计算机能够按照它们自己的逻辑去做一些事情,比如给它一个三角形,告诉它这是个三角形,这个机器从此之后就认识这个东西就是三角形。通常的方法就是通过从数据里面去学,给它大量的例子,告诉它说不同形状的这些东西都是三角形,然后在某个瞬间它再看到一个三条边的一个形状的时候,它可能就会知道这个东西三角形,通过从这样一个数据里面,通过一定的算法来学到这个东西是三角形,这样的一个经验,或者是这样的一个知识。
(2)Here are few pictures of Black Bears and Grizzly Bears...
If I show you this...
You know it's a Black Bear from the previous pictures.
But the pictures I trained you with were all taken from the side.
Why didn't that confuse you?
Your brain was smart enough to find a pattern in the training pictures(nose, color) without being explicitly told what to look for.
第二个例子去识别黑熊和灰熊,左边是黑熊图片,右边是微熊的图片,如果给一张黑熊的图片,如果人来看肯定知道这个是一个黑熊,因为在前面已经见了大量的黑熊的这样一个知识,但如果给的都是一些侧面的照片,为什么这样一张照片?还是能知道它是黑熊,因为人可以从鼻子颜色清楚的知道它就是黑熊。
Machine Learning allows computers to learn in the same way.
基于学习希望机器也能够跟人的学习方式一样去让这个机器去学习,最终目标甚至都没有办法去区分在面前的到底是一个人还是一个机器。
(3)Lets look at a real example involving the Titanic...
Can you find out if this person survived or not?
Thanks to Machine Learning, computers can digest this data in an instant to make accurate predictions.
比如泰坦尼克号里面,已经知道哪些人哪个年龄段他在哪个仓位的这些人,最后在泰坦尼克号里面他们活下来了,有这样一个数据,如果现在一个男性29岁,他是一等舱的,那么这个人到底是存活还是没有存活,人能够从给出的 Excel 表格里面能学到一些规则,经验等,最后可能对这样一个事情来进行一些预测或者一些推测,有机器学习,可以把这样的数据给它,那么它就能自己去消耗这样一些数据,通过这些数据能够做的一个非常准确的预测,比如前面的例子,29岁的男性一等舱之后可能很大概率上面它会存活。年龄,性别,仓位可以把它称之为特征抽取。
四、举例
Feature Engineering and Selection
Feature Extraction-- Spam Filter
Feature Extraction -Medical Diagnosi
Predict whether a patient will survive?
Features?
Heart rate
Age
比如常常用到这样一个垃圾邮件的过滤,比如收到了一个邮件公司的阿里云邮箱识别出这个是一个可能的垃圾邮件,它可能的做法是把一些常用的词给收集起来,去看这些常用词的邮件里面出现了多少,来判定它这个是不是一个垃圾邮件,用于一个普通的捕捉贝叶斯,就能把这个准确率做到非常高,那么它里面特征可以认为就是把里面的词来当做这样一个特征。
White blood cell count
① FE is manually designing what the inputx's should be, use business experience and data driven insights to identify what in the data is correlated to the target
②Brainstorm features(理解业务)→Devise features(统计类、ID类…数值化/归一化…)>Select features(feature importance、正则化、univariate statistical tests…)
第二个例子是医学的诊断,要看一个病人最后能不能生存下来,能不能存活。
比如说像心率、年龄或者白细胞的数目等等,可以想出一系列的特征就会来预判这个人是不是会存活。所以关于这个特征都统称为特征的这样一个工程。这个工程是一门非常大的一个学科,它里面牵扯到特征的构造、特征的处理、特征的选择等等,那特征工程就是去输入变量X应该是一个什么样的东西?
特征工程需要用到一些商业的经验,还有对数据的洞察,去识别出说在这个数据里面哪些跟最终的目标是相关的,然后把这样一些东西把它当做一些特征,理解业务的基础上,可能最后还需要去做很多的一些特征的处理,比如去设计一些统计类的特征,这个人在这个月之内登录了多少次登支付宝这一类的一个统计类的特征,ID 类的特征,比如这个人的学历,是不是有小孩等等,还有可能大量的这样一个文本类的特征,把它数据化归一化之后,这中间也有非常多的统计学上的一些处理方法,可以对这样一些变量进行一些处理完之后,一般是说把这样一些特征送到一个机器学习的算法里面去,让他们来进行学习,学完之后来看他的效果之后,可以通过一定的方式去选择这样一些跟这个目标非常相关的一些或者说的目标对目标贡献比较大的一些特征。
比如一个特征重要程度,通过这种特征的重要程度来进行筛选,比如通过这样一个逻辑回归里面的智能化,通过智能化的方式把一些不重要的特征把它惩罚掉,甚至通过统计学里面的一些 test 的方式来去选择一些特征。总之特征工程是一个非常大的学科。
Fun time
Which of the following is best suited for machine learning?
A. predicting whether the next cry the baby girl happens at an even-numbered minute or not
B. determining whether a given graph containis a cycle
C. deciding whether to approve credit card to some çustomer
D. guessing whether the earth will be destroyed by the misuse of nuclear power in the next ten years
ABCD、4个场景,哪个场景最适用于这样一个机器学习呢?这个答案跟蚂蚁金服的可能未来的一些金融相关业务比较相关,对其他的几个答案或者其他的几个答案场景跟这些学习相对离得远一点,有一些是可以通过数学上有些公式可以去判定,有一些是没有样本,还有一些是没有办法去用一些方法去进行预测。