Pandas数据显示不全?快来了解这些设置技巧! ⛵

简介: 资深工程师最常用的 Pandas 显示设置技巧!Pandas数据显示不全?快来了解这些设置技巧,自定义显示的行数、列数、列宽,使浮点列之间的小数位精度保持一致、禁用科学记数法…
5055f495fc3b44a6a8c8d00176e542f7~tplv-k3u1fbpfcp-zoom-1.image
💡 作者: 韩信子@ ShowMeAI
📘 数据分析实战系列http://www.showmeai.tech/tutorials/40
📘 本文地址http://www.showmeai.tech/article-detail/285
📢 声明:版权所有,转载请联系平台与作者并注明出处
📢 收藏 ShowMeAI查看更多精彩内容

📌 Pandas 数据显示的问题

a449586cbffb4a31a55a92cd277116de~tplv-k3u1fbpfcp-zoom-1.image

我们在应用 Python 进行数据分析挖掘和机器学习时,最常用的工具库就是 Pandas,它可以帮助我们快捷地进行数据处理和分析。

4539b793d5ee4810914f007103da692a~tplv-k3u1fbpfcp-zoom-1.image
对 Pandas 不熟悉的同学,一定要学习下这个宝藏工具库哦!ShowMeAI 给大家做了一个详尽的教程,可以在 📘 Python 数据分析教程 中查看,我们同时也制作了 📘 Pandas速查表,方便大家快速查找需要的功能。如果你喜欢跟着视频学习,那么推荐B站这个 📘 快速实战教程

但在使用 Pandas 时,我们经常会遇到像下面这样一些问题,它很影响我们查看数据了解详情。

🔔 长文本无法显示全

对于非常长的字段可能显示不全,如下图中,URL 被缩短显示。

2d0087b3b25e4a67a5619f35a4d34ebd~tplv-k3u1fbpfcp-zoom-1.image

🔔 科学计数法显示失去细节

Pandas 默认使用『科学计数法』显示大浮点数,例如 1000000.5 显示为 1.000e+06 。对于数值较大的数字,就可能有如下的显示,这导致我们看不到具体数值。

819205584b074b558ca619e354eaa04c~tplv-k3u1fbpfcp-zoom-1.image

🔔 小数位精度不一致

对于浮点型的字段列,Pandas 可能有不同的位精度。例如下图中,col_1 精确到小数点后一位,而 col_2 精确到小数点后三位。有时候精度的不一致可能会有信息的差异。

3e6ba450c68645799a13296420fef7e1~tplv-k3u1fbpfcp-zoom-1.image

在本篇内容中,ShowMeAI 将介绍如何使用 Pandas 自定义设置来解决诸如上述的问题。主要的设置包括下面内容:

  • 自定义要显示的行数
  • 自定义要显示的列数
  • 自定义列宽
  • 使浮点列之间的小数位精度保持一致
  • 禁用科学记数法
  • 其他用法
注意:以上设置仅更改数据的显示呈现方式,实际并不会影响Dataframe存储的数据。

📌 Pandas自定义显示设置

fc24b2ed69c64f5e97fc963511083c28~tplv-k3u1fbpfcp-zoom-1.image

💡 自定义显示行数

打印大 Dataframe(行列数很多的数据)时,Pandas 默认显示前 5 行和后 5 行,如下图所示。

f0f5411f4c4c41e7b4000995681dd9f4~tplv-k3u1fbpfcp-zoom-1.image

我们可以通过设置显示选项 display.max_rows 来更改要显示的行数,比如我们将其设置为4。

pd.set_option("display.max_row", 4)
df
7e849a4e3fec4df6a32e9913fa8b5cb4~tplv-k3u1fbpfcp-zoom-1.image

我们可以使用重置选项 pd.reset_option("display.max_rows") 恢复默认行数显示设置。

💡 自定义显示列数

同样的道理,我们可以通过设置 display.max_columns 自定义输出 Dataframe 时要显示的列数。

pd.set_option("display.max_columns", 6)
df
6b383a7ff4f54fc89b18862b03974d27~tplv-k3u1fbpfcp-zoom-1.image

我们甚至可以设置 pd.set_option('display.max_columns',` `None) 来显示所有列(但是大家需要注意一下内存使用,这个操作可能让 Jupyter Notebook 一下占用特别多资源)。

我们同样可以使用 pd.reset_option("display.max_columns") 重置返回到默认设置。

💡 自定义列宽

在下图中,我们看不到前两行的全文,因为它们的字符太长(长度超过了 50)。

0808ad1a99204ad09e4435b5d87cda80~tplv-k3u1fbpfcp-zoom-1.image

我们把设置 display.max_colwidth调整到 70,就可以看到全文了,如下图所示。

pd.set_option("display.max_colwidth", 70)
df
2b216327af054fc5833d3ca42158bea6~tplv-k3u1fbpfcp-zoom-1.image

对这个设置重置的操作依旧是pd.reset_option("display.max_colwidth")

💡 设置字段小数位精度一致

前面提到的一个例子中,col_1col_2 的小数位精度不一致:

b07a38491db849a5ba6ee2f1c52a033c~tplv-k3u1fbpfcp-zoom-1.image

我们可以通过设置 display.float_format"{:.2f}".format 使格式一致,如下图所示。

该选项只会影响浮点列,而不影响整数列。
pd.set_option("display.float_format", "{:.2f}".format)
df
7ba391a9b63a46d6821514deda6286b3~tplv-k3u1fbpfcp-zoom-1.image

对这个设置重置的操作是 pd.reset_option("display.float_format")

💡 禁用科学计数法

Pandas 默认以科学计数法显示较大的浮点值。

eec53ce71c0e4093adb2feacac743591~tplv-k3u1fbpfcp-zoom-1.image

通过设置 display.float_format"{:,.2f}".format,我们可以为千位添加分隔符。

pd.set_option("display.float_format", "{:,.2f}".format)
df
53bd2c30c03c4ce8a7682d9de6840fed~tplv-k3u1fbpfcp-zoom-1.image

我们甚至可以添加货币符号在数值前面,比如我们把 display.float_format 设置为 "$ {:,.2f}".format,得到如下结果:

pd.set_option("display.float_format", "$ {:,.2f}".format)
df
061b5ebab53c44a9b0378467c2e31ad0~tplv-k3u1fbpfcp-zoom-1.image

💡 其他设置

上面列到的是一些最常用的设置,如果我们记不住这些设置名称,或者我们想了解全部可以调整的显示设置,可以怎么办呢?实际上大家可以借助pd.describe_option()获得所有可用显示设置的列表。

针针对某个特定的显示设置,可以在 pd.describe_option()中传入想调整的显示设置名称来获取使用细节,例如我们运行pd.describe_option("max_rows")将打印描述 display.max_rows使用细节,如下图所示。

pd.describe_option("max_rows")
325d66ce26fa4a918704d1161efef5be~tplv-k3u1fbpfcp-zoom-1.image

参考资料

e9190f41b8de4af38c8a1a0c96f0513b~tplv-k3u1fbpfcp-zoom-1.image

目录
相关文章
|
3月前
|
数据处理 Python
如何使用Python的Pandas库进行数据排序和排名
【4月更文挑战第22天】Pandas Python库提供数据排序和排名功能。使用`sort_values()`按列进行升序或降序排序,如`df.sort_values(by='A', ascending=False)`。`rank()`函数用于计算排名,如`df['A'].rank(ascending=False)`。多列操作可传入列名列表,如`df.sort_values(by=['A', 'B'], ascending=[True, False])`和分别对'A'、'B'列排名。
62 2
|
3月前
|
存储 Python
使用Pandas库对非数值型数据进行排序和排名
在Pandas中,支持对非数值型数据排序和排名。可按以下方法操作:1) 字符串排序,使用`sort_values()`,如`sorted_df = df.sort_values(by='Name', ascending=False)`进行降序排序;2) 日期排序,先用`to_datetime()`转换,再排序,如`sorted_df = df.sort_values(by='Date')`;3) 自定义排序,结合`argsort()`和自定义规则。
52 2
|
3月前
|
Python
如何使用Python的Pandas库进行数据透视图(melt/cast)操作?
Pandas的`melt()`和`pivot()`函数用于数据透视。基本步骤:导入pandas,创建DataFrame,然后使用这两个函数变换数据。示例代码:导入pandas,定义一个包含'Name'和'Age'列的DataFrame,使用`melt()`转为长格式,再用`pivot()`恢复为宽格式。
94 1
|
3月前
|
索引 Python
如何使用Python的Pandas库进行数据合并和拼接?
Pandas的`merge()`函数用于数据合并,如示例所示,根据'key'列对两个DataFrame执行内连接。`concat()`函数用于数据拼接,沿轴0(行)拼接两个DataFrame,并忽略原索引。
74 2
|
1月前
|
机器学习/深度学习 数据可视化 搜索推荐
Python在社交媒体分析中扮演关键角色,借助Pandas、NumPy、Matplotlib等工具处理、可视化数据及进行机器学习。
【7月更文挑战第5天】Python在社交媒体分析中扮演关键角色,借助Pandas、NumPy、Matplotlib等工具处理、可视化数据及进行机器学习。流程包括数据获取、预处理、探索、模型选择、评估与优化,以及结果可视化。示例展示了用户行为、话题趋势和用户画像分析。Python的丰富生态使得社交媒体洞察变得高效。通过学习和实践,可以提升社交媒体分析能力。
51 1
|
3月前
|
存储 JSON 数据处理
从JSON数据到Pandas DataFrame:如何解析出所需字段
从JSON数据到Pandas DataFrame:如何解析出所需字段
204 1
|
19天前
|
存储 数据可视化 Python
Python中的数据可视化:使用Matplotlib和Pandas探索数据
【7月更文挑战第31天】 在数据科学的世界里,可视化是理解复杂数据集的关键。本文将引导你通过Python的Matplotlib库和Pandas库来揭示数据背后的故事。我们将一起构建图表,从简单的线图到复杂的热图,每一步都将用代码示例来丰富你的理解。文章不仅仅是展示如何绘制图表,更是一次深入探索数据结构和模式的旅程。
40 8
|
5天前
|
Python
Pandas 读取Eexcel - 间隔N行,读取某列数据
Pandas 读取Eexcel - 间隔N行,读取某列数据
10 0
|
18天前
|
Python
【Pandas】Pandas的DataFrame按行插入list数据或者读取一行并存为csv文件
本文提供了使用Pandas库对DataFrame进行操作的示例代码。
21 0