iris数据集数据处理

简介: iris数据集数据处理

iris数据集共有150个样本,目标变量为花的类别其都属于鸢尾属下的三个亚属(target),分别是山鸢尾 (Iris-setosa),变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。

 

四个特征,分别是花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)、花瓣宽度(petal width)。

 

1.1 导入函数

1 import numpy as np 
2 import pandas as pd
3 import matplotlib.pyplot as plt
4 import seaborn as sns

 

1.2 导入数据

1 from sklearn.datasets import load_iris
2 data = load_iris() 
3 iris_target = data.target 
4 iris_features = pd.DataFrame(data=data.data, columns=data.feature_names) #利用Pandas转化为DataFrame格式

1.3 简单数据查看

1 ## 查看数据的整体信息
2 iris_features.info()
  3 
4 ## 查看每个类别数量
5 pd.Series(iris_target).value_counts()

  image.png

## 查看head或tail
iris_features.head()
#iris_features.tail()

  image.png

## 对于特征进行一些统计描述
iris_features.describe()

image.png

相关文章
|
8月前
|
数据采集 监控 安全
数据预处理
【2月更文挑战第25天】
|
2月前
|
数据挖掘 数据格式 Python
《Python数据分析实战:利用Pandas处理大规模数据集》
《Python数据分析实战:利用Pandas处理大规模数据集》
73 1
|
5月前
|
存储 数据挖掘 API
多快好省地使用pandas分析大型数据集
多快好省地使用pandas分析大型数据集
|
8月前
|
机器学习/深度学习 数据采集 算法
DataFrame 与机器学习:数据预处理与特征工程
【5月更文挑战第19天】数据预处理(如处理缺失值、标准化)和特征工程对机器学习模型的性能至关重要。使用`pandas`进行缺失值填充,`StandardScaler`实现数据标准化,通过创建新特征(如从日期提取月份、对数变换价格)和特征组合增强信息。相关性分析帮助选择重要特征,提升模型准确性和泛化能力。灵活运用这些方法能有效提升模型性能。DataFrame简化了数据操作,助力高效机器学习。
113 1
|
8月前
|
数据处理 Python
iris数据集数据处理
iris数据集数据处理
179 2
|
8月前
|
数据可视化 算法 数据挖掘
R语言鸢尾花iris数据集的层次聚类分析
R语言鸢尾花iris数据集的层次聚类分析
|
8月前
|
数据采集 Python
利用Pandas对小费数据集进行数据预处理实战(附源码)
利用Pandas对小费数据集进行数据预处理实战(附源码)
307 0
|
机器学习/深度学习 数据采集 算法
机器学习之PyTorch和Scikit-Learn第4章 构建优秀的训练数据集 - 数据预处理Part 2
我们在第1章 赋予计算机学习数据的能力和第3章 使用Scikit-Learn的机器学习分类器之旅中简单地介绍了将数据集划分为训练集和测试集的概念。在测试集中比较预测标签和真实标签可以看成是发布上线前对模型的无偏差性能评估。本节中,我们会准备一个新的数据集,葡萄酒数据集。在预处理完数据集后,我们会探讨不同的特征选择技术来对数据集降维。
300 0
机器学习之PyTorch和Scikit-Learn第4章 构建优秀的训练数据集 - 数据预处理Part 2
|
机器学习/深度学习 大数据 API
机器学习鸢尾花数据集分析
机器学习鸢尾花数据集分析
175 0
|
分布式计算 大数据 Hadoop
大数据预处理
大数据预处理
125 0

相关课程

更多