python数据分析和可视化【2】鸢尾花数据分析

简介: python数据分析和可视化【2】鸢尾花数据分析

实验要求:

读取iris数据集中鸢尾花的萼片、花瓣长度数据(已保存为csv格式),并对其进行排序、去重,并求出和、累计和、均值、标准差、方差、最小值、最大值。

步骤:

1.导入模块 (格式为import … as …)

2.获取数据:可利用csv模块进行读取,也可用其他方法进行读取

3.数据清理:对读取的数据进行处理(将索引号去掉等等)

4.数据统计

(1)将鸢尾花数据集的花瓣长度进行排序。

(2)查看鸢尾花数据集中有几种花瓣长度。(首先提取所有数据的花瓣长度,然后进行去重)

(3)求数据中花瓣长度的和,均值,方差,最小值及最大值。

通过以上操作,可以发现鸢尾花数据集中哪些信息?

数据集:

代码:

# 步骤1:导入模块
import pandas as pd
import numpy as np
# 步骤2:获取数据
iris_data = pd.read_csv('C:\\Users\86178\Desktop\iris.csv')
# 步骤3:数据清理
petal_length = iris_data['Sepal.Length']    #获取长度列,返回一个series序列
# 步骤4:数据统计
# (1) 将鸢尾花数据集的花瓣长度进行排序
sorted_petal_length = petal_length.sort_values()   #对序列中的值进行排序
# (2) 查看鸢尾花数据集中有几种花瓣长度
unique_petal_length = sorted_petal_length.unique()  #返回序列中所有不重复的元素,返回ndarray数组
# (3) 求数据中花瓣长度的和、均值、方差、最小值及最大值
sum_petal_length = petal_length.sum()
mean_petal_length = petal_length.mean()
var_petal_length = petal_length.var()
std_petal_length = petal_length.std()
min_petal_length = petal_length.min()
max_petal_length = petal_length.max()
# 输出结果
print("排序后的花瓣长度数据:")
print(sorted_petal_length)
print("\\n鸢尾花数据集中有几种花瓣长度:", len(unique_petal_length))
print("\\n花瓣长度的和:", sum_petal_length)
print("花瓣长度的均值:", mean_petal_length)
print("花瓣长度的方差:", var_petal_length)
print("花瓣长度的标准差:", std_petal_length)
print("花瓣长度的最小值:", min_petal_length)
print("花瓣长度的最大值:", max_petal_length)

运行结果:

目录
相关文章
|
8天前
|
数据挖掘 计算机视觉 Python
Python数据分析13
Pillow 是 PIL(Python Imaging Library)的升级版本,适应 Python 3 的更新而诞生,带来了诸多新特性。它采用模块化结构,主要包括:图像功能模块(Image)、图像滤波功能模块(ImageFilter)、图像增强功能模块(ImageEnhance)和图像绘画功能模块(ImageDraw)。Pillow 支持从多种图像格式读取数据,进行处理,并能输出为常见格式,其官网提供了丰富的应用示例供学习参考。
24 4
|
6天前
|
SQL 数据采集 数据可视化
深入 Python 数据分析:高级技术与实战应用
本文系统地介绍了Python在高级数据分析中的应用,涵盖数据读取、预处理、探索及可视化等关键环节,并详细展示了聚类分析、PCA、时间序列分析等高级技术。通过实际案例,帮助读者掌握解决复杂问题的方法,提升数据分析技能。使用pandas、matplotlib、seaborn及sklearn等库,提供了丰富的代码示例,便于实践操作。
121 64
|
2天前
|
数据可视化 数据挖掘 大数据
Python 数据分析入门:从零开始处理数据集
Python 数据分析入门:从零开始处理数据集
|
2天前
|
数据采集 数据可视化 数据挖掘
Python中的数据分析:从零开始的指南
Python中的数据分析:从零开始的指南
10 2
|
2天前
|
机器学习/深度学习 数据采集 数据可视化
数据分析之旅:用Python探索世界
数据分析之旅:用Python探索世界
7 2
|
2天前
|
数据采集 数据可视化 数据挖掘
使用Python进行数据分析:从入门到实践
使用Python进行数据分析:从入门到实践
8 2
|
7天前
|
机器学习/深度学习 数据可视化 数据挖掘
使用Python进行数据分析的入门指南
【9月更文挑战第33天】本文旨在为初学者提供一个关于使用Python进行数据分析的全面概述。我们将从基本的安装和设置开始,逐步介绍数据处理、数据可视化以及机器学习的基本概念和应用。文章将通过实际代码示例来展示如何使用Python及其相关库来解决常见的数据分析问题。
|
2天前
|
数据采集 数据挖掘 API
Python数据分析加速器:深度挖掘Pandas与NumPy的高级功能
在Python数据分析的世界里,Pandas和NumPy无疑是两颗璀璨的明星,它们为数据科学家和工程师提供了强大而灵活的工具集,用于处理、分析和探索数据。今天,我们将一起深入探索这两个库的高级功能,看看它们如何成为数据分析的加速器。
15 1
|
10天前
|
数据挖掘 Serverless 计算机视觉
Python数据分析 11
SciPy是一款专为数学、科学及工程应用设计的开源软件,它基于NumPy的n维数组构建,提供了丰富的数值例程,包括积分、优化、线性代数等,适用于各种操作系统,安装简易且免费。它还包含了如快速傅里叶变换、信号处理、图像处理、特殊函数计算等功能,满足了科学计算与工程需求。相较于NumPy的一般数组,SciPy提供了真正的矩阵及其相关运算支持。
30 7
|
10天前
|
机器学习/深度学习 数据挖掘 算法框架/工具
Python数据分析6
Keras是一个用Python编写的深度学习框架,支持TensorFlow等多种后端,以其高度模块化、用户友好性和易扩展性著称。它不仅适用于搭建普通神经网络,还能够构建自编码器、循环神经网络、卷积神经网络等多种模型,并且可以无缝切换CPU和GPU。相比Theano,Keras极大简化了神经网络模型的搭建过程,使普通用户也能轻松创建复杂的深度学习模型,仅需几十行代码即可完成。需要注意的是,Keras的预测函数采用`model.predict()`输出概率,`model.predict_classes()`输出分类结果。
24 6