Pandas之二查看数据

简介: 通过pandas查看dataframe的数据,包括head、tail、index、columns、describe、T、sort_index和sort_values

上文我们聊过了在pandas中的对象创建,其中最常用的对象就是dataframe,今天我们来聊聊怎么样其中的数据。

pandas提供了丰富的查看数据的手段:

  • head:查看最前面的几行
  • tail:查看最后面的几行
  • index:查看index
  • columns:查看列名
  • describe:查看dataframe的几个统计量,包括总数、均值、标准差、最小值、最大值、25%分位数、50%分位数和75%分位数
  • T:转置后的dataframe
  • sort_index:使用index进行排序
  • sort_values:对其中的值进行排序

下面以上文中的创建的两个dataframe来演示各方法的具体用法

  • df

df

  • df2

df2

head

使用head查看数据时,默认展示前5行,同时可以使用参数指定需要展示的行数。

head

tail

使用tail查看数据时,默认展示最后5行,同时可以使用参数指定需要展示的行数。
tail

index

index是dataframe的一个属性,可以直接使用df.index进行属性查看

index

columns

同样,列名columns也是其属性,可以直接使用df.columns查看
index

describe

使用decribe方法查看dataframe的常用统计量,使用该方法会默认忽略非数字类型的列,比如在df2中使用,会忽略B,E,F列
describe

T转置

在做矩阵计算时,经常会要用到转置,可以方便地使用T来实现,熟悉数据库的也可以将其理解为行列转换。
T

sort_index

可以使用index对dataframe进行排序,可以使用参数指标排序的index和方式,常用的参数为axis、ascending和inplace

  • axis:指定通过行或列的index进行排序,值为0时使用行index,值为1时使用columns
  • ascending:指定排序的方式,False从大到小排序,True从小到大排序
  • inplace:排序后是否替代原dataframe,True为替换,False不替换,默认为False,使用该参数后方法不返回值

sort_index

sort_values

除了使用index进行排序,也可以对具体的值进行排序,常用的参数有by、axis、ascending和inplace

  • by:值排序所用的列名或index名,可以输入列表。
  • axis:指定通过行或列进行排序,0表示行,1表示列。需要注意的是如果by使用的是列名,axis只能为0;若by使用的是行index,axis只能为1。
  • ascending与inplace的含义与sort_index相同。

sort_values

目录
相关文章
|
1月前
|
Python
使用 Pandas 库时,如何处理数据的重复值?
在使用Pandas处理数据重复值时,需要根据具体的数据特点和分析需求,选择合适的方法来确保数据的准确性和唯一性。
160 8
|
1天前
|
编解码 数据挖掘 开发者
Pandas数据导出:CSV文件
Pandas是Python中强大的数据分析库,提供了灵活的数据结构如DataFrame和Series。通过`to_csv()`函数可轻松将数据保存为CSV文件。本文介绍了基本用法、常见问题(如编码、索引、分隔符等)及解决方案,并涵盖大文件处理和报错解决方法,帮助用户高效导出数据。
108 83
|
8天前
|
存储 数据挖掘 数据处理
Pandas 数据筛选:条件过滤
Pandas 是 Python 最常用的数据分析库之一,提供了强大的数据结构和工具。本文从基础到高级,介绍如何使用 Pandas 进行条件过滤,包括单一条件、多个条件过滤、常见问题及解决方案,以及动态和复杂条件过滤的高级用法。希望本文能帮助你更好地利用 Pandas 处理数据。
117 78
|
5天前
|
数据挖掘 数据处理 数据库
Pandas数据聚合:groupby与agg
Pandas库中的`groupby`和`agg`方法是数据分析中不可或缺的工具,用于数据分组与聚合计算。本文从基础概念、常见问题及解决方案等方面详细介绍这两个方法的使用技巧,涵盖单列聚合、多列聚合及自定义聚合函数等内容,并通过代码案例进行说明,帮助读者高效处理数据。
65 32
|
3天前
|
数据挖掘 数据处理 索引
Pandas数据重命名:列名与索引为标题
Pandas 是强大的数据分析工具,支持灵活的数据结构和操作。本文介绍如何使用 Pandas 对 `DataFrame` 的列名和索引进行重命名,包括直接赋值法、`rename()` 方法及索引修改。通过代码示例展示了具体操作,并讨论了常见问题如名称冲突、数据类型不匹配及 `inplace` 参数的使用。掌握这些技巧可使数据更清晰易懂,便于后续分析。
41 29
|
4天前
|
SQL 数据采集 数据挖掘
Pandas数据合并:concat与merge
Pandas是Python中强大的数据分析库,提供灵活高效的数据结构和工具。本文详细介绍了Pandas中的两种主要合并方法——`concat`和`merge`。`concat`用于沿特定轴连接多个Pandas对象,适用于简单拼接场景;`merge`则类似于SQL的JOIN操作,根据键合并DataFrame,支持多种复杂关联。文章还探讨了常见问题及解决方案,如索引对齐、列名冲突和数据类型不一致等,帮助读者全面掌握这两种方法,提高数据分析效率。
23 8
|
10天前
|
数据挖掘 索引 Python
Pandas数据读取:CSV文件
Pandas 是 Python 中强大的数据分析库,`read_csv` 函数用于从 CSV 文件中读取数据。本文介绍 `read_csv` 的基本用法、常见问题及其解决方案,并通过代码案例详细说明。涵盖导入库、读取文件、指定列名和分隔符、处理文件路径错误、编码问题、大文件读取、数据类型问题、日期时间解析、空值处理、跳过行、指定索引列等。高级用法包括自定义列名映射、处理多行标题和注释行。希望本文能帮助你更高效地使用 Pandas 进行数据读取和处理。
57 13
|
7天前
|
算法 数据挖掘 索引
Pandas数据排序:单列与多列排序详解
本文介绍了Pandas库中单列和多列排序的方法及常见问题的解决方案。单列排序使用`sort_values()`方法,支持升序和降序排列,并解决了忽略大小写、处理缺失值和索引混乱等问题。多列排序同样使用`sort_values()`,可指定不同列的不同排序方向,解决列名错误和性能优化等问题。掌握这些技巧能提高数据分析效率。
38 9
|
1月前
|
Python
|
1月前
|
Python