Machine Learning-L1-机器学习pipeline

简介: Machine Learning-L1-机器学习pipeline

机器学习pipeline



20200414075255695.png

一个典型的机器学习包括以下几个过程:


1. 定义问题


理解实际场景是机器学习的第一步,需要将业务问题抽象为机器学习能处理的数学问题,包括明确可以获得哪些数据、什么样的数据、数据是怎样的格式,原始数据需要做怎样的处理,机器学习的目标是一个分类、回归还是聚类等。


2. 获取数据


“ 数据决定机器学习结果的上限,而算法只是尽可能的逼近这个上限”。获取的数据需要业务相关,能够解决业务问题,并且是全面的、客观的,具有“代表性”的数据。


3. 数据处理


现实世界的数据一般是不完整的、有噪声的和不一致的。机器学习80%的时间都是在做数据处理,数据处理是机器学习的基础步骤。

数据预处理、数据清洗决定的数据质量,特征工程是机器学习的关键,主要包括从清洗后的数据中,根据实际业务场景提取特征,筛选出显著特征、摒弃非显著特征,需要结合领域知识反复迭代,这对很多结果有决定性的影响。此外还需对特征进行转换、离散化、归一化等。


4. 模型训练、评估与调优


选择合适的模型并通过训练数据训练模型,通过测试数据,评估模型的有效性,分析原因,提升算法性能。


5. 模型部署


模型上线运行,根据准确程度、误差等情况,还包括其运行的速度(时间复杂度)、资源消耗程度(空间复杂度)、稳定性

不断迭代优化。

相关文章
|
24天前
|
机器学习/深度学习 数据采集 人工智能
Machine Learning机器学习之贝叶斯网络(BayesianNetwork)
Machine Learning机器学习之贝叶斯网络(BayesianNetwork)
|
24天前
|
机器学习/深度学习 算法 搜索推荐
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
Machine Learning机器学习之决策树算法 Decision Tree(附Python代码)
|
2月前
|
机器学习/深度学习
Coursera 吴恩达Machine Learning(机器学习)课程 |第五周测验答案(仅供参考)
Coursera 吴恩达Machine Learning(机器学习)课程 |第五周测验答案(仅供参考)
|
机器学习/深度学习 数据采集 算法
机器学习基础:令你事半功倍的pipeline处理机制
机器学习基础:令你事半功倍的pipeline处理机制
机器学习基础:令你事半功倍的pipeline处理机制
|
9月前
|
机器学习/深度学习 数据采集 算法
Scikit-learn中的Pipeline:让机器学习流程更加简单、高效、可靠
Scikit-learn是一个非常流行的机器学习库,提供了各种各样的算法、工具和API,让用户可以轻松地构建和调整机器学习模型。其中一个非常有用的工具是Pipeline,它可以将多个数据预处理步骤和机器学习模型组合在一起,构建起整个机器学习流程。 在这篇博客中,我们将介绍Scikit-learn中的Pipeline,包括Pipeline的基本概念、使用方法和实际案例。这篇博客将将解如何使用Pipeline来构建高效且可靠的机器学习流程,使你的机器学习任务更加简单、高效和可靠。
|
11月前
|
机器学习/深度学习 数据采集 分布式计算
Spark机器学习管道 - Pipeline
Spark机器学习管道 - Pipeline
|
机器学习/深度学习 数据采集 算法
机器学习中令你事半功倍的pipeline处理机制​
机器学习中令你事半功倍的pipeline处理机制​
机器学习中令你事半功倍的pipeline处理机制​
|
机器学习/深度学习 人工智能 自然语言处理
Machine Learning-L0-机器学习简介
Machine Learning-L0-机器学习简介
Machine Learning-L0-机器学习简介
|
机器学习/深度学习 人工智能 自然语言处理
全球名校AI课程库(20)| Stanford斯坦福 · 图机器学习课程『Machine Learning with Graphs』
课程对于graph方向的数据挖掘、机器学习(神经网络)有全面的知识覆盖。如果想学习非结构化的图数据上的各类算法,这是最权威的课程之一。
2257 1
全球名校AI课程库(20)| Stanford斯坦福 · 图机器学习课程『Machine Learning with Graphs』
|
机器学习/深度学习 人工智能 自然语言处理
全球名校AI课程库(13)| CMU卡内基梅隆 · 多模态机器学习课程『Multimodal Machine Learning』
课程以多模态(MMML)为主题,讲解基本概念、多种数据形态联合建模方法,并回顾近期MMML概率模型和计算算法的论文,讨论当前面临的挑战。
2304 1
全球名校AI课程库(13)| CMU卡内基梅隆 · 多模态机器学习课程『Multimodal Machine Learning』

热门文章

最新文章