Sklearn介绍3

简介: Sklearn介绍

sklearn能即用的数据形式
numpy二维数组的稠密数据(dense data)
scipy矩阵的稀疏数据(sparse data)

数据大小 = [ 样本数,特征数 ] (行, 列)
image.png
核心API
估计器 fit()
任何可以基于数据集对一些参数进行估计的对象都被称为估计器
两个核心点:1.需要输入数据,2.可以估计参数。估计器首先被创建,然后被拟合。
预测器 predict() | score()
预测器在估计器上延展出预测功能
两个核心点:1.基于学到的参数预测,2.预测有很多指标。最常见的就是predict()函数
model.predict(X_test):评估模型在新数据上的表现
model.predict(X_train):确定模型在老数据上的表现
装换器
装换器也是一种估计器,两者都带有拟合功能,但估计器做完拟合来预测,而装换器做完拟合来装换
核心点:估计器里fit+predict,装换器里先创建再fit+再transform
警示: fit() 函数只能作用在训练集上,千万不要作用在测试集上,要不然你就犯了数据窥探的错误了!拿标准化举例,用训练集 fit 出来的均值和标准差参数,来对测试集做标准化。
image.png

目录
相关文章
|
8月前
|
机器学习/深度学习 算法 数据挖掘
sklearn-决策树
sklearn-决策树
82 0
|
8月前
|
算法
sklearn算法
sklearn算法
58 0
|
机器学习/深度学习 算法 计算机视觉
使用sklearn进行特征选择
背景 一个典型的机器学习任务,是通过样本的特征来预测样本所对应的值。如果样本的特征少,我们会考虑增加特征。而现实中的情况往往是特征太多了,需要减少一些特征。
|
6月前
|
机器学习/深度学习 算法 数据挖掘
sklearn
【7月更文挑战第26天】
85 10
一、线性回归的两种实现方式:(二)sklearn实现
一、线性回归的两种实现方式:(二)sklearn实现
|
机器学习/深度学习 API
sklearn相关3
sklearn介绍
130 1
|
机器学习/深度学习
Sklearn介绍2
Sklearn介绍
87 0
|
数据挖掘
Sklearn介绍1
Sklearn介绍
166 0
|
机器学习/深度学习 算法
sklearn集成学习之VotingClassifier
sklearn集成学习之VotingClassifier
sklearn集成学习之VotingClassifier
|
机器学习/深度学习 数据采集 资源调度
浅析sklearn中的数据预处理方法
在日常的机器学习开发过程中,基本的机器学习过程如下图所示。