iris数据集数据处理

简介: iris数据集数据处理

iris数据集共有150个样本,目标变量为花的类别其都属于鸢尾属下的三个亚属(target),分别是山鸢尾 (Iris-setosa),变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。

 

四个特征,分别是花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)、花瓣宽度(petal width)。

 

1.1 导入函数

1 import numpy as np 
2 import pandas as pd
3 import matplotlib.pyplot as plt
4 import seaborn as sns

 

1.2 导入数据

1 from sklearn.datasets import load_iris
2 data = load_iris() 
3 iris_target = data.target 
4 iris_features = pd.DataFrame(data=data.data, columns=data.feature_names) #利用Pandas转化为DataFrame格式

1.3 简单数据查看

1 ## 查看数据的整体信息
2 iris_features.info()
  3 
4 ## 查看每个类别数量
5 pd.Series(iris_target).value_counts()

  image.png

## 查看head或tail
iris_features.head()
#iris_features.tail()

  image.png

## 对于特征进行一些统计描述
iris_features.describe()

image.png

相关文章
|
4月前
|
机器学习/深度学习 存储 算法
MNIST数据集简介
【7月更文挑战第24天】MNIST数据集简介。
122 2
|
6月前
|
数据处理 Python
iris数据集数据处理
iris数据集数据处理
130 2
|
6月前
|
数据可视化 算法 数据挖掘
R语言鸢尾花iris数据集的层次聚类分析
R语言鸢尾花iris数据集的层次聚类分析
|
6月前
|
数据可视化 API 算法框架/工具
Python用T-SNE非线性降维技术拟合和可视化高维数据iris鸢尾花、MNIST 数据
Python用T-SNE非线性降维技术拟合和可视化高维数据iris鸢尾花、MNIST 数据
|
机器学习/深度学习 前端开发 测试技术
数据集相关知识
数据集相关知识
295 0
|
机器学习/深度学习 数据采集 算法
UCI数据集详解及其数据处理(附148个数据集及处理代码)
UCI数据集详解及其数据处理(附148个数据集及处理代码)
2587 1
|
机器学习/深度学习 存储 数据可视化
|
机器学习/深度学习 监控 Devops
Sklean数据集(1)-鸢尾花
Sklean数据集(1)-鸢尾花
124 0
|
机器学习/深度学习 算法 数据挖掘
机器学习 基于IRIS鸢尾花数据集进行聚类分析
机器学习 基于IRIS鸢尾花数据集进行聚类分析
672 0
机器学习 基于IRIS鸢尾花数据集进行聚类分析