13个Pandas实用技巧,请收好(上)

简介: 归纳整理了一些工作中常用到的pandas使用技巧,方便更高效地实现数据分析。文章很短,不用收藏就能Get~

1.计算变量缺失率

1.png

如果需要计算样本的缺失率分布,只要加上参数axis=1.


2.获取分组里最大值所在的行方法

分为分组中有重复值和无重复值两种。无重复值的情况。

2.png

先按Mt列进行分组,然后对分组之后的数据框使用idxmax函数取出Count最大值所在的列,再用iloc位置索引将行取出。有重复值的情况

3.png

对ID进行分组之后再对分数应用rank函数,分数相同的情况会赋予相同的排名,然后取出排名为1的数据。


3.多列合并为一行


4.png

4.删除包含特定字符串所在的行

5.png

5.组内排序

6.png

介绍两种高效地组内排序的方法。

7.png

6.选择特定类型的列

8.png

7.字符串转换为数值

9.png



   


相关文章
|
2月前
|
机器学习/深度学习 数据挖掘 API
6个冷门但实用的pandas知识点
6个冷门但实用的pandas知识点
6个冷门但实用的pandas知识点
|
2月前
|
分布式计算 大数据 数据处理
别说你会用Pandas
别说你会用Pandas
|
5月前
|
监控 数据挖掘 数据处理
《Pandas 简易速速上手小册》第6章:Pandas 时间序列分析(2024 最新版)
《Pandas 简易速速上手小册》第6章:Pandas 时间序列分析(2024 最新版)
51 1
|
5月前
|
数据采集 SQL 数据可视化
《Pandas 简易速速上手小册》第5章:Pandas 数据合并与重塑(2024 最新版)
《Pandas 简易速速上手小册》第5章:Pandas 数据合并与重塑(2024 最新版)
60 1
|
5月前
|
数据采集 机器学习/深度学习 自然语言处理
《Pandas 简易速速上手小册》第7章:Pandas 文本和类别数据处理(2024 最新版)
《Pandas 简易速速上手小册》第7章:Pandas 文本和类别数据处理(2024 最新版)
59 1
|
5月前
|
数据采集 机器学习/深度学习 数据挖掘
《Pandas 简易速速上手小册》第4章:Pandas 数据探索与处理(2024 最新版)
《Pandas 简易速速上手小册》第4章:Pandas 数据探索与处理(2024 最新版)
55 1
|
5月前
|
数据采集 数据挖掘 数据处理
《Pandas 简易速速上手小册》第3章:Pandas 数据清洗基础(2024 最新版)
《Pandas 简易速速上手小册》第3章:Pandas 数据清洗基础(2024 最新版)
44 1
|
5月前
|
存储 Linux 数据库
长文预警,一篇文章扫盲Python、NumPy 和 Pandas,建议收藏慢慢看
长文预警,一篇文章扫盲Python、NumPy 和 Pandas,建议收藏慢慢看
|
SQL 存储 Java
【Python】【Numpy+Pandas数据处理·闯关】和鲸社区学习笔记day(2)
【Python】【Numpy+Pandas数据处理·闯关】和鲸社区学习笔记day(2)
313 0
|
数据处理 索引 Python
【Python】【Numpy+Pandas数据处理·闯关】和鲸社区学习笔记day(4)
【Python】【Numpy+Pandas数据处理·闯关】和鲸社区学习笔记day(4)
384 0

相关实验场景

更多