三分钟了解下机器学习

简介: 机器学习是一种从数据生成规则、发现模型,来帮助我们预测、判断、分组和解决问题的技术。

什么是机器学习?

机器学习是一种从数据生成规则、发现模型,来帮助我们预测、判断、分组和解决问题的技术。(机器学习是一种从数据中生产函数,而不是程序员直接编写函数的技术)
说起函数就涉及到自变量和因变量,在机器学习中,把自变量叫做特征(feature)多个自变量分别可以定义为X1,X2..Xn,因变量叫做标签(label),可定义为y,而一批特征和标签的集合,就是机器学习的数据集。
机器学习的学习过程就是在已知的数据集的基础上,通过反复的计算,选择最准确的函数去描述数据集中自变量X1,X2....Xn 和因变量Y之间的因果关系。这个过程就称之为机器学习的训练也叫拟合。
这里还需要明确几个概念,训练集、验证集、测试集
训练集,最开始用来训练的数据集被称为训练集。
验证集,验证模型是否能够被推广、泛化,评估模型是否过拟合
测试集,用来评估模最终模型的泛化能力,相当于举一反三的能力

机器学习分类

主要分类是根据机器学习在训练过程中是否有标签。

  • 监督学习:训练的数据集全部都有标签,根据标签的特点 监督学习可以分为两类问题:回归和分类,回归问题的标签是连续的数值,比如预测房价、股市等,分类问题的标签是离散的数值,比如人脸识别、判断是否正确等,判断两款运营策略哪种更有效。

image.png

分类算法:逻辑回归、决策树分类、SVM分类、贝叶斯分类、随机森林、XGBoost、KNN...
回归算法:线性回归、 决策树回归、SVN回归、贝叶斯回归...

  • 无监督学习:训练数据集没有标签,多应用在聚类、降维等有限的场景中,比如说为用户做分组画像,另外通常也会作为数据预处理的一个子步骤中。

降维算法、聚类算法...

  • 半监督学习:有的数据有标签、有的数据没有标签。往往是因为获取数据标签的难度很高,半监督学习与监督学习是很相似的,主要在与多了伪标签生成环节,也就是给无标签的数据人工 贴标签。
    半监督分类、半监督回归、半监督聚类、半监督降维
  • 强化学习:针对于一些既不能用监督学习也不能用半监督和无监督学习来解决,这时候强化学习就上场了,它针对是智能体(可以理解成一种机器学习模型)如何基于环境而做出行动反应,以获得最大化的累积奖励。其与监督学习的差异在于监督学习是从数据中进行学习,而强化学习是从环境给他的奖惩中学习。
    Q-learning,SARSA,深度强化网络、蒙特卡洛学习...

image.png

如何理解深度学习?

常说的深度学习是一种使用深层神经网络的模型,可以应用于上述四类机器学习中,深度学习擅长处理非结构化输入,在视觉处理和自然语言处理方面都很厉害。
深度学习,能对非结构的数据集进行自动的复杂特征提取,完全不需要人工干预。

机器学习落地思路

做机器学习项目,首先要先明确要解决的问题,其次,再针对问题选择一个算法,然后用对数据进行训练,找到一族函数中最合适的那一个行程最后的模型。

目录
相关文章
|
2月前
|
机器学习/深度学习 自然语言处理
机器学习查漏补缺
机器学习查漏补缺
|
5月前
|
机器学习/深度学习 数据采集 算法
机器学习入门:算法与数据的探索之旅
【6月更文挑战第13天】本文介绍了机器学习的基础,包括算法和数据处理的重要性。机器学习算法分为监督学习(如线性回归、决策树)、非监督学习(如聚类、降维)和强化学习。数据处理涉及数据清洗、特征工程、数据分割及标准化,是保证模型性能的关键。对于初学者,建议学习基础数学、动手实践、阅读经典资料和参与在线课程与社区讨论。
|
机器学习/深度学习 算法 JavaScript
AIGC背后的技术分析 | 机器学习?机器如何学习?
通过Julia的语法、函数、编译器使机器学习技术变得更加简单。
191 1
AIGC背后的技术分析 |  机器学习?机器如何学习?
|
机器学习/深度学习 人工智能 自然语言处理
机器学习都能做些什么呢
回归问题通常用来预测一个值,其标签的值是连续的。例如,预测房价、未来的天气等任何连续性的走势、数值。比较常见的回归算法是线性回归(linear regression)算法以及深度学习中的神经网络等。 分类问题是将事物标记一个类别标签,结果为离散值,也就是类别中的一个选项,例如,判断一幅图片上的动物是一只猫还是一只狗。分类有二元分类和多元分类,每类的最终正确结果只有一个。分类是机器学习的经典应用领域,很多种机器学习算法都可以用于分类,包括最基础的逻辑回归算法、经典的决策树算法,以及深度学习中的神经网络等。还有从多元分类上衍生出来的多标签分类问题,典型应用如社交网站中上传照片时的自动标注人名功能,
154 0
|
机器学习/深度学习 传感器 人工智能
闭眼推荐,9 个不能错过的机器学习数据集
闭眼推荐,9 个不能错过的机器学习数据集
236 0
|
机器学习/深度学习 人工智能 自然语言处理
作业帖 | NLP+推荐-深度学习集训营 【第一次作业】
作业帖 | NLP+推荐-深度学习集训营 【第一次作业】
103 0
作业帖 | NLP+推荐-深度学习集训营 【第一次作业】
|
机器学习/深度学习 分布式计算 算法
系列小作文之企业级机器学习pipline总结
系列小作文之企业级机器学习pipline总结
|
机器学习/深度学习 数据采集 数据挖掘
开启机器学习懒人模式——AutoGluon小试某数据挖掘训练赛
近来在浏览DataCastle竞赛平台时,注意到了上面挂载的一些数据挖掘训练赛题目,因为是定位于训练赛,主要用于帮助初学者快速熟悉和练手机器学习技能,所以赛题难度相对基础,也没有提供实质性的竞赛奖励
782 0
开启机器学习懒人模式——AutoGluon小试某数据挖掘训练赛
|
机器学习/深度学习 人工智能 算法
机器学习(十四) 机器学习比赛网站
机器学习(十四) 机器学习比赛网站
162 0
|
机器学习/深度学习 大数据 数据挖掘
大数据算命系列之用机器学习评估你的相亲战斗力 | 《阿里云机器学习PAI-DSW入门指南》
害,想知道你的相亲战斗力是多少吗?动手体验数据科学,成为PAI-DSW探索者~你想要知道的都在这里!
大数据算命系列之用机器学习评估你的相亲战斗力 | 《阿里云机器学习PAI-DSW入门指南》