iris数据集数据处理
iris数据集共有150个样本,目标变量为花的类别其都属于鸢尾属下的三个亚属(target),分别是山鸢尾 (Iris-setosa),变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。
四个特征,分别是花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)、花瓣宽度(petal width)。
1.1 导入函数
1 import numpy as np
2 import pandas as pd
3 import matplotlib.pyplot as plt
4 import seaborn as sns
1.2 导入数据
1 from sklearn.datasets import load_iris
2 data = load_iris()
3 iris_target = data.target
4 iris_features = pd.DataFrame(data=data.data, columns=data.feature_names) #利用Pandas转化为DataFrame格式
1.3 简单数据查看
1 ## 查看数据的整体信息
2 iris_features.info()
3
4 ## 查看每个类别数量
5 pd.Series(iris_target).value_counts()
## 查看head或tail
iris_features.head()
#iris_features.tail()
## 对于特征进行一些统计描述
iris_features.describe()