Pandas之八Reshaping(一)

简介: 数据分析时,有时会要对数据做一些变形才能更好地分析,Pandas提供了灵活的方法应对该场景,包括`stack`和`pivot table`

数据分析时,有时会要对数据做一些变形才能更好地分析,Pandas提供了灵活的方法应对该场景,包括stackpivot table

  • stack:将dataframe中的列转为行。
  • pivot table:数据透视表,功能比较丰富,大多数场景都可适用。

下面使用图中两套数据对这两个功能进行说明

1. Stack

Stack提供了行转列与列转行的操作,使用.stack将列转为行,还可以使用.unstack将行转为列(stack的逆操作),返回的是SeriesDataFrame

1.1 Stack

将dataframe中指定level的列转为行,在上图数据列是单层,其列的level值既是0(类似于列表下标从0开始)也是-1(同列表下标倒数)。

  • level的默认值为-1,即将最内层的列转为行
  • 若dataframe中的列是单层,返回的是一个Series
  • 若dataframe有多层列,返回的是一个将指定level列转为行的dataframe

对示例数据做列转行操作

  1. 将最内层列(level=-1)转为行

    # 以下写法效果一致
    df8.stack()
    df8.stack(-1)
    df8.stack(1)

  1. 将weight转为行,(level=0level=-2

    df8.stack(0)
    df8.stack(-2)

  1. 将所有列都转为行,此时返回Series,同时可以看到其有多重索引

    s1=df8.stack([0,1])

1.2 unstack

unstackstack的逆操作,将DataFrame或Series中指定level的index转为列。

  • level值默认为-1,即将最内层的index转为列
  • 如果index只有一层,返回的值将是一个Series
  • 若index有多层,而未全部转为列,返回的值是一个DataFrame

对上文中的结果s1执行.unstack操作

  1. 将最内层index转为列

    # 以下语句执行效果一致
    s1.unstack()
    s1.unstack(-1)
    s1.unstack(2)

  1. 将中间层index转为列

    s1.unstack(1)
    s1.unstack(-2)

  1. 将多个index转为列

    s1.unstack([1,2])

目录
相关文章
|
8月前
|
存储 缓存 Rust
Polars (最强Pandas平替)
Polars (最强Pandas平替)
251 1
|
机器学习/深度学习 数据采集 数据挖掘
Python 数据分析入门教程:Numpy、Pandas、Matplotlib和Scikit-Learn详解
Python 数据分析入门教程:Numpy、Pandas、Matplotlib和Scikit-Learn详解
266 0
|
SQL 索引 Python
Pandas之三选择数据
介绍在pandas中筛选数据的几种方法,快速定位某行、某列、具体元素的方法
823 0
Pandas之三选择数据
|
5月前
|
分布式计算 大数据 数据处理
别说你会用Pandas
别说你会用Pandas
|
6月前
|
数据采集 数据挖掘 数据格式
pandas怎么用
【7月更文挑战第9天】pandas怎么用
36 2
|
7月前
|
数据采集 机器学习/深度学习 数据挖掘
Pandas简易入门指南
在数据科学和数据分析的世界中,Pandas库以其强大的数据处理能力而闻名。作为一个基于Python的开源库,Pandas提供了快速、灵活和富有表现力的数据结构,旨在使数据处理变得简单和直观。无论是处理时间序列数据、统计数据分析,还是进行数据清洗和准备,Pandas都是数据科学家的首选工具之一。
75 4
|
8月前
|
数据可视化 数据挖掘 C++
数据分析综合案例讲解,一文搞懂Numpy,pandas,matplotlib,seaborn技巧方法
数据分析综合案例讲解,一文搞懂Numpy,pandas,matplotlib,seaborn技巧方法
169 2
|
8月前
|
监控 数据挖掘 数据处理
《Pandas 简易速速上手小册》第6章:Pandas 时间序列分析(2024 最新版)
《Pandas 简易速速上手小册》第6章:Pandas 时间序列分析(2024 最新版)
70 1
|
8月前
|
SQL 机器学习/深度学习 数据处理
10个Pandas的高级技巧
Pandas是我们最常用的数据处理Python库之一。尽管您可能已经与它共事多年,但可能还有许多您尚未探索的实用方法。我将向您展示一些可能未曾听说但在数据整理方面非常实用的方法。
164 0
|
机器学习/深度学习 人工智能 数据挖掘
pandas快速入门指南
Pandas 是一个开源的第三方 Python 库,从 Numpy 和 Matplotlib 的基础上构建而来,享有数据分析“三剑客之一”的盛名(NumPy、Matplotlib、Pandas)。是学习数据分析、AI机器学习必学组件之一。 Pandas 这个名字来源于面板数据(Panel Data)与数据分析(data analysis)这两个名词的组合。在经济学中,Panel Data 是一个关于多维数据集的术语。Pandas 对数据的处理是为数据的分析服务的,它所提供的各种数据处理方法、工具是基于数理统计学出发,包含了日常应用中的众多数据分析方法。
128 0
pandas快速入门指南