iris数据集共有150个样本,目标变量为花的类别其都属于鸢尾属下的三个亚属(target),分别是山鸢尾 (Iris-setosa),变色鸢尾(Iris-versicolor)和维吉尼亚鸢尾(Iris-virginica)。
四个特征,分别是花萼长度(sepal length)、花萼宽度(sepal width)、花瓣长度(petal length)、花瓣宽度(petal width)。
1.1 导入函数
1 import numpy as np 2 import pandas as pd 3 import matplotlib.pyplot as plt 4 import seaborn as sns
1.2 导入数据
1 from sklearn.datasets import load_iris 2 data = load_iris() 3 iris_target = data.target 4 iris_features = pd.DataFrame(data=data.data, columns=data.feature_names) #利用Pandas转化为DataFrame格式
1.3 简单数据查看
1 ## 查看数据的整体信息 2 iris_features.info() 3 4 ## 查看每个类别数量 5 pd.Series(iris_target).value_counts()
## 查看head或tail iris_features.head() #iris_features.tail()
## 对于特征进行一些统计描述 iris_features.describe()