【Python数据分析 - 13】:pandas的统计分析

简介: 【Python数据分析 - 13】:pandas的统计分析

pandas的统计分析


数据准备

3fccd65fe19b46b58382e4445179ca2d.png



最小值:idxmin(axis)、最大值:idxmax(axis)


在使用idxmin和idxmax时,axis=0表示列,axis=1表示行


aa7e215f0a4444989df932aa71ff2b8a.png

6fddc099613f424fb041c7125931b0c1.png


求累加结果:cumsum()

74b3915038224c759b2a8ac1a45d418f.png

查看累加后的图形

863aec0bf9ee403faa6643b5f477530c.png


逻辑运算与通过运算符


  • 查看p_change>2的情况


dc7908f4561a442883f0d813f9772a43.png


将p_change大于2的数据整体取出

681eba71b49c44c4a7fa7baf209f749a.png


使用&(与)和 | (或)语句


  • 查看p_change>2和low>0.1的数据

0dbb0b790db04a0f8842e5866042746c.png


将p_change>2和low>0.1的数据整体取出

d7019a92a718457db39afd97048c00b9.png


将p_change>2 或 low>0.1的数据整体取出

61548613899d4eb880a9c6d7ebdd2521.png


使用query()函数(常用)


  • 将p_change>2和low>0.1的数据整体取出


a34e0374c1864e0999fe753e340a82ec.png


isin函数 – 查看值中是否存在


isin函数用于查看某列中是否包含某个字符串,返回值为布尔Series,来表明每一行的情况。


  • 查看open列中是否存在值为0.210的数据

fe1014f1a5a24718a58e5f19f2850fea.png

将open列中存在值为0.210的数据取出

ee25edebe44f4e66953a8cdb3aa8d355.png

add加法、sub减法

  • 例一:将high列减去open列


9806cc22beb54f3e97ca1b828019115c.png


例一:将high列加上open列

eed6df509e9c403b92b3fe218534a5e6.png


自定义运算 - apply()


0e068b53e8704d568b7478c53ffd6a5d.png

相关文章
|
3月前
|
自然语言处理 数据挖掘 数据处理
告别低效代码:用对这10个Pandas方法让数据分析效率翻倍
本文将介绍 10 个在数据处理中至关重要的 Pandas 技术模式。这些模式能够显著减少调试时间,提升代码的可维护性,并构建更加清晰的数据处理流水线。
143 3
告别低效代码:用对这10个Pandas方法让数据分析效率翻倍
|
3月前
|
数据采集 数据可视化 搜索推荐
Python数据分析全流程指南:从数据采集到可视化呈现的实战解析
在数字化转型中,数据分析成为企业决策核心,而Python凭借其强大生态和简洁语法成为首选工具。本文通过实战案例详解数据分析全流程,涵盖数据采集、清洗、探索、建模、可视化及自动化部署,帮助读者掌握从数据到业务价值的完整技能链。
391 0
|
10月前
|
数据采集 数据可视化 数据挖掘
Pandas数据应用:天气数据分析
本文介绍如何使用 Pandas 进行天气数据分析。Pandas 是一个强大的 Python 数据处理库,适合处理表格型数据。文章涵盖加载天气数据、处理缺失值、转换数据类型、时间序列分析(如滚动平均和重采样)等内容,并解决常见报错如 SettingWithCopyWarning、KeyError 和 TypeError。通过这些方法,帮助用户更好地进行气候趋势预测和决策。
308 71
|
5月前
|
机器学习/深度学习 数据采集 数据可视化
Python数据分析,别再死磕Excel了!
Python数据分析,别再死磕Excel了!
196 2
|
10月前
|
机器学习/深度学习 数据可视化 数据挖掘
使用Python进行数据分析的入门指南
本文将引导读者了解如何使用Python进行数据分析,从安装必要的库到执行基础的数据操作和可视化。通过本文的学习,你将能够开始自己的数据分析之旅,并掌握如何利用Python来揭示数据背后的故事。
|
10月前
|
存储 数据采集 数据可视化
Pandas数据应用:电子商务数据分析
本文介绍如何使用 Pandas 进行电子商务数据分析,涵盖数据加载、清洗、预处理、分析与可视化。通过 `read_csv` 等函数加载数据,利用 `info()` 和 `describe()` 探索数据结构和统计信息。针对常见问题如缺失值、重复记录、异常值等,提供解决方案,如 `dropna()`、`drop_duplicates()` 和正则表达式处理。结合 Matplotlib 等库实现数据可视化,探讨内存不足和性能瓶颈的应对方法,并总结常见报错及解决策略,帮助提升电商企业的数据分析能力。
382 73
|
8月前
|
Python
python pandas学习(一)
该代码段展示了四个主要操作:1) 删除指定列名,如商品id;2) 使用正则表达式模糊匹配并删除列,例如匹配订单商品名称1的列;3) 将毫秒级时间戳转换为带有时区调整的日期时间格式,并增加8小时以适应本地时区;4) 将列表转换为DataFrame后保存为Excel文件,文件路径和名称根据变量拼接而成。
93 3
|
9月前
|
存储 数据采集 数据可视化
Pandas数据应用:医疗数据分析
Pandas是Python中强大的数据操作和分析库,广泛应用于医疗数据分析。本文介绍了使用Pandas进行医疗数据分析的常见问题及解决方案,涵盖数据导入、预处理、清洗、转换、可视化等方面。通过解决文件路径错误、编码不匹配、缺失值处理、异常值识别、分类变量编码等问题,结合Matplotlib等工具实现数据可视化,并提供了解决常见报错的方法。掌握这些技巧可以提高医疗数据分析的效率和准确性。
257 22
|
8月前
|
机器学习/深度学习 存储 数据可视化
这份Excel+Python飞速搞定数据分析手册,简直可以让Excel飞起来
本书介绍了如何将Python与Excel结合使用,以提升数据分析和处理效率。内容涵盖Python入门、pandas库的使用、通过Python包操作Excel文件以及使用xlwings对Excel进行编程。书中详细讲解了Anaconda、Visual Studio Code和Jupyter笔记本等开发工具,并探讨了NumPy、DataFrame和Series等数据结构的应用。此外,还介绍了多个Python包(如OpenPyXL、XlsxWriter等)用于在无需安装Excel的情况下读写Excel文件,帮助用户实现自动化任务和数据处理。
|
9月前
|
存储 数据挖掘 数据处理
Python Pandas入门:行与列快速上手与优化技巧
Pandas是Python中强大的数据分析库,广泛应用于数据科学和数据分析领域。本文为初学者介绍Pandas的基本操作,包括安装、创建DataFrame、行与列的操作及优化技巧。通过实例讲解如何选择、添加、删除行与列,并提供链式操作、向量化处理、索引优化等高效使用Pandas的建议,帮助用户在实际工作中更便捷地处理数据。
209 2

热门文章

最新文章

推荐镜像

更多