python数据分析基础009 -利用pandas带你玩转excel表格(下篇)

简介: python数据分析基础009 -利用pandas带你玩转excel表格(下篇)

文章要点

🍺前言image.png💦(一)利用pandas对数据求和,算平均数image.png

💨1. 在excel表格中实现image.png

结果:

需要完成以上结果在pandas中又如何实现呢?

💨2.在pandas中进行实现image.png

import pandas as pd
test = pd.read_excel('./excel/test008.xlsx',index_col="ID")
df = pd.DataFrame(test)
# 求总和
sum = df[['Test_1','Test_2','Test_3']].sum(axis=1)
# 求平均值
avg = df[['Test_1','Test_2','Test_3']].mean(axis=1)
df['total'] = sum
df['avg'] = avg
# 求总计的平均值
T_avg = df[['Test_1','Test_2','Test_3','total','avg']].mean()
T_avg['Name'] = 'avg_total'
df =df.append(T_avg,ignore_index=True)
print(df)

image.png结果:

这样就实现了上述结果。

💦(二)消除重复数据image.png

💨1.在excel中进行实现image.png

需要实现以上结果,在pandas中要如何进行操作呢?pandas还有什么强大的功能呢,让我们一起来看看吧!

💨2.在pandas中实现image.png

import pandas as pd
test = pd.read_excel('./excel/test009.xlsx')
df = pd.DataFrame(test)
# 消除重复数据
df.drop_duplicates(subset='Name',inplace=True,keep='last')
print(df)

结果:

利用keep参数我们将前面重复的数据删除而保留了后面的数据,这就是pandas对比excel的一强大之处。而在此方面,pandas远不止于此,pandas还可以将重复的数据筛选出来。

💫2.1 利用pandas将重复的数据筛选出来image.png

import pandas as pd
test = pd.read_excel('./excel/test009.xlsx')
df = pd.DataFrame(test)
re = df.duplicated(subset='Name')
# 找出重复项
re = re[re == True]
# re.index 找出重复数据的索引
print(df.iloc[re.index])

结果:

对上面两点,足以说明pandas在对excel数据进行操作时还是比excel更胜一筹的。

💦(三)数据转置在excel表中,有些数据需要转置看起来才更明了,更直观。那么在excel和pandas中要如何操作呢?

实例:将下列数据进行转置

💨1.在excel中进行实现image.png

结果:

那在pandas中又如何操作呢?是否更快捷更简单呢?

💨2.在pandas中进行操作结果:

image.png

import pandas as pd
test = pd.read_excel('./excel/test010.xlsx',index_col="Month")
df = pd.DataFrame(test)
# 将数据转置
table = df.transpose()
# 显示所有数据,若不设置则中间数据不显示
pd.options.display.max_columns = 100
print(table)

结果:

这样就实现了上述结果,pandas相对来说处理数据更方便快捷!!

🍻结语

今天的内容就到这里啦,希望看到此文的小伙伴能有所收获,另外pandas在excel中还有很多操作需要探索,关注我,咱们下期再见!!

相关文章
|
8天前
|
数据采集 数据可视化 数据挖掘
Pandas数据应用:天气数据分析
本文介绍如何使用 Pandas 进行天气数据分析。Pandas 是一个强大的 Python 数据处理库,适合处理表格型数据。文章涵盖加载天气数据、处理缺失值、转换数据类型、时间序列分析(如滚动平均和重采样)等内容,并解决常见报错如 SettingWithCopyWarning、KeyError 和 TypeError。通过这些方法,帮助用户更好地进行气候趋势预测和决策。
102 71
|
1月前
|
机器学习/深度学习 数据可视化 数据挖掘
使用Python进行数据分析的入门指南
本文将引导读者了解如何使用Python进行数据分析,从安装必要的库到执行基础的数据操作和可视化。通过本文的学习,你将能够开始自己的数据分析之旅,并掌握如何利用Python来揭示数据背后的故事。
|
7天前
|
存储 数据采集 数据可视化
Pandas数据应用:电子商务数据分析
本文介绍如何使用 Pandas 进行电子商务数据分析,涵盖数据加载、清洗、预处理、分析与可视化。通过 `read_csv` 等函数加载数据,利用 `info()` 和 `describe()` 探索数据结构和统计信息。针对常见问题如缺失值、重复记录、异常值等,提供解决方案,如 `dropna()`、`drop_duplicates()` 和正则表达式处理。结合 Matplotlib 等库实现数据可视化,探讨内存不足和性能瓶颈的应对方法,并总结常见报错及解决策略,帮助提升电商企业的数据分析能力。
106 73
|
4天前
|
存储 数据采集 数据可视化
Pandas数据应用:医疗数据分析
Pandas是Python中强大的数据操作和分析库,广泛应用于医疗数据分析。本文介绍了使用Pandas进行医疗数据分析的常见问题及解决方案,涵盖数据导入、预处理、清洗、转换、可视化等方面。通过解决文件路径错误、编码不匹配、缺失值处理、异常值识别、分类变量编码等问题,结合Matplotlib等工具实现数据可视化,并提供了解决常见报错的方法。掌握这些技巧可以提高医疗数据分析的效率和准确性。
42 22
|
9天前
|
数据采集 数据可视化 索引
Pandas数据应用:股票数据分析
本文介绍了如何使用Pandas库进行股票数据分析。首先,通过pip安装并导入Pandas库。接着,从本地CSV文件读取股票数据,并解决常见的解析错误。然后,利用head()、info()等函数查看数据基本信息,进行数据清洗,处理缺失值和重复数据。再者,结合Matplotlib和Seaborn进行数据可视化,绘制收盘价折线图。最后,进行时间序列分析,设置日期索引、重采样和计算移动平均线。通过这些步骤,帮助读者掌握Pandas在股票数据分析中的应用。
40 5
|
2月前
|
机器学习/深度学习 算法 数据挖掘
数据分析的 10 个最佳 Python 库
数据分析的 10 个最佳 Python 库
102 4
数据分析的 10 个最佳 Python 库
|
2月前
|
存储 数据可视化 数据挖掘
使用Python进行数据分析和可视化
本文将引导你理解如何使用Python进行数据分析和可视化。我们将从基础的数据结构开始,逐步深入到数据处理和分析的方法,最后通过实际的代码示例来展示如何创建直观的数据可视化。无论你是初学者还是有经验的开发者,这篇文章都将为你提供有价值的见解和技巧。让我们一起探索数据的世界,发现隐藏在数字背后的故事!
|
2月前
|
存储 数据可视化 数据挖掘
Python数据分析项目:抖音短视频达人粉丝增长趋势
Python数据分析项目:抖音短视频达人粉丝增长趋势
|
2月前
|
数据采集 存储 数据可视化
Python数据分析:揭秘"黑神话:悟空"Steam用户评论趋势
Python数据分析:揭秘"黑神话:悟空"Steam用户评论趋势
|
2月前
|
数据采集 数据可视化 数据挖掘
掌握Python数据分析,解锁数据驱动的决策能力
掌握Python数据分析,解锁数据驱动的决策能力