机器学习:sklearn数据集简介

简介: 机器学习:sklearn数据集简介

算法分类

监督学习 特征值 + 目标值
    -分类 目标值是离散数据
    -回归 目标值是连续数据
无监督学习  只有特征值
    -聚类

数据集

数据

-训练集 80% 70% 75%

-测试集 20% 30% 25%

数据拆分:

sklearn.model_selection.train_test_split

sklearn数据集

sklearn.datasets
  -小规模数据集
      -datasets.load_*()
      -已下载
  -大规模数据集
      -datasets.fetch_*()
      - 需要下载默认目录:~/scikit_learn_data/

数据类型

datasets.base.Bunch(字典格式)
    data:特征数据 二维数组[n_samples * n_features]
    target: 标签数组
    DESCR: 数据描述
    feature_names:特征名(新闻数据,手写数字,回归数据集没有)
    target_names:标签名

数据集介绍

分类数据集
    鸢尾花数据集 sklearn.datasets.load_iris
    新闻数据集 sklearn.datasets.fetch_20newsgroups
回归数据集
    波士顿房价数据集 sklearn.datasets.load_boston
    糖尿病数据集 sklearn.datasets.load_diabetes


相关文章
|
10月前
|
监控 安全 调度
彻底解决5大开源痛点,阿里云发布任务调度 XXL-JOB 版
阿里云任务调度XXL-JOB版 迎来重磅发布,以任务调度SchedulerX为内核,0代码改造,完全兼容开源XXL-JOB客户端接入,解决开源XXL-JOB痛点问题。
1375 133
|
负载均衡 Java API
Java一分钟之-Spring Cloud OpenFeign:声明式服务调用
【6月更文挑战第9天】Spring Cloud OpenFeign是声明式服务调用库,简化了微服务间调用。通过动态代理,它允许开发者用Java接口调用HTTP服务,支持服务发现、负载均衡。本文介绍了OpenFeign的基本概念,展示了如何添加依赖、开启客户端和定义服务接口。还讨论了接口调用失败、超时重试和日志配置等问题及其解决方案,并提供了自定义Feign配置的代码示例。通过学习,读者可以更好地在微服务架构中使用OpenFeign进行服务通信。
591 4
|
11月前
|
机器学习/深度学习 人工智能 算法
【AI系统】AI 系统与程序代码关系
本文探讨了AI系统与程序代码之间的关系,通过PyTorch实现LeNet5神经网络模型为例,详细介绍了AI训练流程原理、网络模型构建方法、算子实现的系统问题以及AI系统执行的具体计算过程。文章不仅解释了神经网络的前向传播和反向传播机制,还深入分析了算子在AI框架中的作用及其底层实现,包括卷积层的具体计算和优化问题。此外,文章对比了使用PyTorch与直接使用cuDNN+CUDA编程实现神经网络模型的差异,强调了AI框架在提高开发效率、自动化内存管理和实现自动微分等方面的重要性。
172 1
|
开发框架 Rust Dart
Flutter、Electron 和 Tauri 框架简介
Flutter、Electron 和 Tauri 框架简介
531 0
Qt在线安装时出现网络错误的解决办法(Windows)
Qt在线安装时出现网络错误的解决办法(Windows)
|
前端开发 Java 关系型数据库
基于Spring MVC + Spring + MyBatis的【图书信息管理系统(二)】
基于Spring MVC + Spring + MyBatis的【图书信息管理系统(二)】
543 1
基于Spring MVC + Spring + MyBatis的【图书信息管理系统(二)】
|
数据采集 Ubuntu Python
Python网络爬虫3 ---- ubuntu下安装爬虫框架scrapy
原文转载自:http://www.cnblogs.com/HelloPython/ 根据Scrapy安装指南(http://doc.
1144 0
|
6天前
|
弹性计算 人工智能 安全
云上十五年——「弹性计算十五周年」系列客户故事(第二期)
阿里云弹性计算十五年深耕,以第九代ECS g9i实例引领算力革新。携手海尔三翼鸟、小鹏汽车、微帧科技等企业,实现性能跃升与成本优化,赋能AI、物联网、智能驾驶等前沿场景,共绘云端增长新图景。
|
12天前
|
存储 弹性计算 人工智能
【2025云栖精华内容】 打造持续领先,全球覆盖的澎湃算力底座——通用计算产品发布与行业实践专场回顾
2025年9月24日,阿里云弹性计算团队多位产品、技术专家及服务器团队技术专家共同在【2025云栖大会】现场带来了《通用计算产品发布与行业实践》的专场论坛,本论坛聚焦弹性计算多款通用算力产品发布。同时,ECS云服务器安全能力、资源售卖模式、计算AI助手等用户体验关键环节也宣布升级,让用云更简单、更智能。海尔三翼鸟云服务负责人刘建锋先生作为特邀嘉宾,莅临现场分享了关于阿里云ECS g9i推动AIoT平台的场景落地实践。
【2025云栖精华内容】 打造持续领先,全球覆盖的澎湃算力底座——通用计算产品发布与行业实践专场回顾
|
3天前
|
云安全 人工智能 安全
Dify平台集成阿里云AI安全护栏,构建AI Runtime安全防线
阿里云 AI 安全护栏加入Dify平台,打造可信赖的 AI