机器学习:sklearn数据集简介

简介: 机器学习:sklearn数据集简介

算法分类

监督学习 特征值 + 目标值
    -分类 目标值是离散数据
    -回归 目标值是连续数据
无监督学习  只有特征值
    -聚类


数据集

数据

-训练集 80% 70% 75%

-测试集 20% 30% 25%


数据拆分:

sklearn.model_selection.train_test_split


sklearn数据集


sklearn.datasets
  -小规模数据集
     -datasets.load_*()
     -已下载
  -大规模数据集
     -datasets.fetch_*()
     - 需要下载默认目录:~/scikit_learn_data/


数据类型


datasets.base.Bunch(字典格式)
    data:特征数据 二维数组[n_samples * n_features]
    target: 标签数组
    DESCR: 数据描述
    feature_names:特征名(新闻数据,手写数字,回归数据集没有)
    target_names:标签名


数据集介绍


分类数据集

   鸢尾花数据集 sklearn.datasets.load_iris

   新闻数据集 sklearn.datasets.fetch_20newsgroups


回归数据集

   波士顿房价数据集 sklearn.datasets.load_boston

   糖尿病数据集 sklearn.datasets.load_diabetes


相关文章
|
3天前
|
机器学习/深度学习 数据采集 人工智能
机器学习之sklearn基础教程
【5月更文挑战第9天】Sklearn是Python热门机器学习库,提供丰富算法和预处理工具。本文深入讲解基础概念、核心理论、常见问题及解决策略。内容涵盖模型选择与训练、预处理、交叉验证、分类回归、模型评估、数据集划分、正则化、编码分类变量、特征选择与降维、集成学习、超参数调优、模型评估、保存加载及模型解释。学习Sklearn是迈入机器学习领域的关键。
15 3
|
4天前
|
机器学习/深度学习 算法 数据挖掘
【机器学习】各大模型原理简介
【机器学习】各大模型原理简介
|
5天前
|
机器学习/深度学习 数据采集 算法
机器学习之sklearn基础教程
机器学习之sklearn基础教程
|
13天前
|
机器学习/深度学习 监控 算法
|
26天前
|
机器学习/深度学习 资源调度 分布式计算
机器学习的线性模型简介
机器学习的线性模型简介
17 0
|
27天前
|
算法框架/工具 TensorFlow 机器学习/深度学习
Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版(九)(2)
Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版(九)
157 0
Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版(九)(2)
|
27天前
|
机器学习/深度学习 算法框架/工具 TensorFlow
Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版(九)(1)
Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版(九)
46 0
Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版(九)(1)
|
27天前
|
机器学习/深度学习 人工智能 算法框架/工具
Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版(八)(4)
Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版(八)
35 0
Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版(八)(4)
|
27天前
|
异构计算 算法框架/工具 TensorFlow
Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版(八)(3)
Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版(八)
25 0
Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版(八)(3)
|
27天前
|
算法 机器学习/深度学习 算法框架/工具
Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版(八)(2)
Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版(八)
44 0
Sklearn、TensorFlow 与 Keras 机器学习实用指南第三版(八)(2)

热门文章

最新文章