13个Pandas实用技巧,请收好(下)

简介: 归纳整理了一些工作中常用到的pandas使用技巧,方便更高效地实现数据分析。文章很短,不用收藏就能Get~

用这种方式转换第三列会出错,因为这列里包含一个代表 0 的下划线,pandas 无法自动判断这个下划线。为了解决这个问题,可以使用 to_numeric() 函数来处理第三列,让 pandas 把任意无效输入转为 NaN。

10.png

8.优化 DataFrame 对内存的占用

方法一:只读取切实所需的列,使用usecols参数

11.png

方法二:把包含类别型数据的 object 列转换为 Category 数据类型,通过指定 dtype 参数实现。

12.png

9.根据最大的类别筛选 DataFrame

13.png

10.把字符串分割为多列

14.png

11.把 Series 里的列表转换为 DataFrame

15.png

12.用多个函数聚合

16.png

13.分组聚合

17.png


通过字典或Series进行分组18.png

相关文章
|
5月前
|
机器学习/深度学习 数据挖掘 API
6个冷门但实用的pandas知识点
6个冷门但实用的pandas知识点
46 4
6个冷门但实用的pandas知识点
|
5月前
|
分布式计算 大数据 数据处理
别说你会用Pandas
别说你会用Pandas
27 0
|
8月前
|
监控 数据挖掘 数据处理
《Pandas 简易速速上手小册》第6章:Pandas 时间序列分析(2024 最新版)
《Pandas 简易速速上手小册》第6章:Pandas 时间序列分析(2024 最新版)
74 1
|
8月前
|
数据采集 机器学习/深度学习 数据可视化
《Pandas 简易速速上手小册》第10章:Pandas 实战案例(2024 最新版)
《Pandas 简易速速上手小册》第10章:Pandas 实战案例(2024 最新版)
63 2
|
8月前
|
数据采集 机器学习/深度学习 数据挖掘
《Pandas 简易速速上手小册》第4章:Pandas 数据探索与处理(2024 最新版)
《Pandas 简易速速上手小册》第4章:Pandas 数据探索与处理(2024 最新版)
76 1
|
8月前
|
数据采集 数据挖掘 数据处理
《Pandas 简易速速上手小册》第3章:Pandas 数据清洗基础(2024 最新版)
《Pandas 简易速速上手小册》第3章:Pandas 数据清洗基础(2024 最新版)
57 1
|
8月前
|
数据采集 机器学习/深度学习 自然语言处理
《Pandas 简易速速上手小册》第7章:Pandas 文本和类别数据处理(2024 最新版)
《Pandas 简易速速上手小册》第7章:Pandas 文本和类别数据处理(2024 最新版)
74 1
|
8月前
|
数据采集 SQL 数据可视化
《Pandas 简易速速上手小册》第5章:Pandas 数据合并与重塑(2024 最新版)
《Pandas 简易速速上手小册》第5章:Pandas 数据合并与重塑(2024 最新版)
77 1
|
8月前
|
数据采集 数据挖掘 数据处理
《Pandas 简易速速上手小册》第1章:Pandas入门(2024 最新版)
《Pandas 简易速速上手小册》第1章:Pandas入门(2024 最新版)
66 1
|
8月前
|
存储 Linux 数据库
长文预警,一篇文章扫盲Python、NumPy 和 Pandas,建议收藏慢慢看
长文预警,一篇文章扫盲Python、NumPy 和 Pandas,建议收藏慢慢看

相关实验场景

更多