python数据分析基础009 -利用pandas带你玩转excel表格(下篇)

简介: python数据分析基础009 -利用pandas带你玩转excel表格(下篇)

文章要点

🍺前言image.png💦(一)利用pandas对数据求和,算平均数image.png

💨1. 在excel表格中实现image.png

结果:

需要完成以上结果在pandas中又如何实现呢?

💨2.在pandas中进行实现image.png

import pandas as pd
test = pd.read_excel('./excel/test008.xlsx',index_col="ID")
df = pd.DataFrame(test)
# 求总和
sum = df[['Test_1','Test_2','Test_3']].sum(axis=1)
# 求平均值
avg = df[['Test_1','Test_2','Test_3']].mean(axis=1)
df['total'] = sum
df['avg'] = avg
# 求总计的平均值
T_avg = df[['Test_1','Test_2','Test_3','total','avg']].mean()
T_avg['Name'] = 'avg_total'
df =df.append(T_avg,ignore_index=True)
print(df)

image.png结果:

这样就实现了上述结果。

💦(二)消除重复数据image.png

💨1.在excel中进行实现image.png

需要实现以上结果,在pandas中要如何进行操作呢?pandas还有什么强大的功能呢,让我们一起来看看吧!

💨2.在pandas中实现image.png

import pandas as pd
test = pd.read_excel('./excel/test009.xlsx')
df = pd.DataFrame(test)
# 消除重复数据
df.drop_duplicates(subset='Name',inplace=True,keep='last')
print(df)

结果:

利用keep参数我们将前面重复的数据删除而保留了后面的数据,这就是pandas对比excel的一强大之处。而在此方面,pandas远不止于此,pandas还可以将重复的数据筛选出来。

💫2.1 利用pandas将重复的数据筛选出来image.png

import pandas as pd
test = pd.read_excel('./excel/test009.xlsx')
df = pd.DataFrame(test)
re = df.duplicated(subset='Name')
# 找出重复项
re = re[re == True]
# re.index 找出重复数据的索引
print(df.iloc[re.index])

结果:

对上面两点,足以说明pandas在对excel数据进行操作时还是比excel更胜一筹的。

💦(三)数据转置在excel表中,有些数据需要转置看起来才更明了,更直观。那么在excel和pandas中要如何操作呢?

实例:将下列数据进行转置

💨1.在excel中进行实现image.png

结果:

那在pandas中又如何操作呢?是否更快捷更简单呢?

💨2.在pandas中进行操作结果:

image.png

import pandas as pd
test = pd.read_excel('./excel/test010.xlsx',index_col="Month")
df = pd.DataFrame(test)
# 将数据转置
table = df.transpose()
# 显示所有数据,若不设置则中间数据不显示
pd.options.display.max_columns = 100
print(table)

结果:

这样就实现了上述结果,pandas相对来说处理数据更方便快捷!!

🍻结语

今天的内容就到这里啦,希望看到此文的小伙伴能有所收获,另外pandas在excel中还有很多操作需要探索,关注我,咱们下期再见!!

相关文章
|
9月前
|
数据采集 数据可视化 数据挖掘
Python数据分析实战:Pandas处理结构化数据的核心技巧
在数据驱动时代,结构化数据是分析决策的基础。Python的Pandas库凭借其高效的数据结构和丰富的功能,成为处理结构化数据的利器。本文通过真实场景和代码示例,讲解Pandas的核心操作,包括数据加载、清洗、转换、分析与性能优化,帮助你从数据中提取有价值的洞察,提升数据处理效率。
461 3
|
11月前
|
数据采集 数据可视化 搜索推荐
Python数据分析全流程指南:从数据采集到可视化呈现的实战解析
在数字化转型中,数据分析成为企业决策核心,而Python凭借其强大生态和简洁语法成为首选工具。本文通过实战案例详解数据分析全流程,涵盖数据采集、清洗、探索、建模、可视化及自动化部署,帮助读者掌握从数据到业务价值的完整技能链。
1281 0
|
8月前
|
数据可视化 大数据 关系型数据库
基于python大数据技术的医疗数据分析与研究
在数字化时代,医疗数据呈爆炸式增长,涵盖患者信息、检查指标、生活方式等。大数据技术助力疾病预测、资源优化与智慧医疗发展,结合Python、MySQL与B/S架构,推动医疗系统高效实现。
|
8月前
|
人工智能 Java Linux
Python高效实现Excel转PDF:无Office依赖的轻量化方案
本文介绍无Office依赖的Python方案,利用Spire.XLS、python-office、Aspose.Cells等库实现Excel与PDF高效互转。支持跨平台部署、批量处理、格式精准控制,适用于服务器环境及自动化办公场景,提升转换效率与系统稳定性。
870 7
|
8月前
|
机器学习/深度学习 监控 数据挖掘
Python 高效清理 Excel 空白行列:从原理到实战
本文介绍如何使用Python的openpyxl库自动清理Excel中的空白行列。通过代码实现高效识别并删除无数据的行与列,解决文件臃肿、读取错误等问题,提升数据处理效率与准确性,适用于各类批量Excel清理任务。
744 0
|
9月前
|
数据可视化 数据挖掘 大数据
基于python大数据的水文数据分析可视化系统
本研究针对水文数据分析中的整合难、分析单一和可视化不足等问题,提出构建基于Python的水文数据分析可视化系统。通过整合多源数据,结合大数据、云计算与人工智能技术,实现水文数据的高效处理、深度挖掘与直观展示,为水资源管理、防洪减灾和生态保护提供科学决策支持,具有重要的应用价值和社会意义。
|
10月前
|
存储 数据挖掘 大数据
基于python大数据的用户行为数据分析系统
本系统基于Python大数据技术,深入研究用户行为数据分析,结合Pandas、NumPy等工具提升数据处理效率,利用B/S架构与MySQL数据库实现高效存储与访问。研究涵盖技术背景、学术与商业意义、国内外研究现状及PyCharm、Python语言等关键技术,助力企业精准营销与产品优化,具有广泛的应用前景与社会价值。
|
11月前
|
开发工具 Python
使用Python和OpenAPI将云上的安全组规则填写入Excel
本文介绍如何通过Python脚本自动化获取阿里云安全组及其规则信息,并将结果导出为Excel表格。相比CLI命令行方式,Python实现更高效、便捷,适用于需要批量处理和交付的场景。
使用Python和OpenAPI将云上的安全组规则填写入Excel
|
机器学习/深度学习 数据采集 数据可视化
基于爬虫和机器学习的招聘数据分析与可视化系统,python django框架,前端bootstrap,机器学习有八种带有可视化大屏和后台
本文介绍了一个基于Python Django框架和Bootstrap前端技术,集成了机器学习算法和数据可视化的招聘数据分析与可视化系统,该系统通过爬虫技术获取职位信息,并使用多种机器学习模型进行薪资预测、职位匹配和趋势分析,提供了一个直观的可视化大屏和后台管理系统,以优化招聘策略并提升决策质量。
1213 4
|
数据采集 数据可视化 数据挖掘
数据分析大神养成记:Python+Pandas+Matplotlib助你飞跃!
在数字化时代,数据分析至关重要,而Python凭借其强大的数据处理能力和丰富的库支持,已成为该领域的首选工具。Python作为基石,提供简洁语法和全面功能,适用于从数据预处理到高级分析的各种任务。Pandas库则像是神兵利器,其DataFrame结构让表格型数据的处理变得简单高效,支持数据的增删改查及复杂变换。配合Matplotlib这一数据可视化的魔法棒,能以直观图表展现数据分析结果。掌握这三大神器,你也能成为数据分析领域的高手!
428 2

推荐镜像

更多