Pandas中的Pivot：数据重塑的艺术-阿里云开发者社区

Pandas中的Pivot：数据重塑的艺术

2024-09-28 54

版权

本文内容由阿里云实名注册用户自发贡献，版权归原作者所有，阿里云开发者社区不拥有其著作权，亦不承担相应法律责任。具体规则请查看《阿里云开发者社区用户服务协议》和《阿里云开发者社区知识产权保护指引》。如果您发现本社区中有涉嫌抄袭的内容，填写侵权投诉表单进行举报，一经查实，本社区将立刻删除涉嫌侵权内容。

简介： Pandas中的Pivot：数据重塑的艺术

导语：在数据分析的海洋中，Pandas库就像一艘强大的战舰，帮助我们航行在数据的洪流中。其中，pivot函数是Pandas中非常强大的一个工具，它能够帮助我们轻松地对数据进行重塑和转换。今天，就让我们一起探索Pandas中pivot的奥秘，看看它是如何助力我们进行数据重塑的！

一、Pandas Pivot：数据重塑的利器

在Pandas中，pivot函数是一种非常有用的数据重塑方法。它可以将数据从长格式转换为宽格式，或者从宽格式转换为长格式。这种转换通常被称为“透视”或“转置”，是数据分析中常见的操作。

二、Pandas Pivot的基本用法pivot函数的基本语法如下：

pivot_table = df.pivot(index=None, columns=None, values=None, aggfunc='mean')

其中，index参数指定透视表的索引列，columns参数指定透视表的列名，values参数指定需要进行聚合的列，aggfunc参数指定聚合函数，默认为'mean'。

下面是一个简单的例子，演示如何使用pivot函数，我们首先来构建一个数据集合：

import pandas as pd    # 创建一个简单的DataFrame  data = {'Name': ['Alice', 'Bob', 'Charlie', 'Alice', 'Bob', 'Charlie'],          'Subject': ['Math', 'Math', 'Math', 'Science', 'Science', 'Science'],          'Score': [85, 90, 78, 92, 88, 95]}  df = pd.DataFrame(data)  df

运行结果如下：

里面有3个人的2种科目的成绩，但数据是以科目来划分的，如果我想知道每个人每一科的成绩，怎么显示，即用Name这一列作为索引，把Subject作为列名。此时，pivot函数就用上了，代码如下：

# 使用pivot函数进行数据重塑  pivot_table1 = df.pivot(index='Name', columns='Subject', values='Score') pivot_table1

通过pivot函数，我们将原始数据从长格式转换为了宽格式，以Name为索引，Subject为列名，Score为值。一行命令就转置转过来了，重新将数据进行梳理。

三、Pandas Pivot的高级用法

除了基本的用法外，pivot函数还支持更多的参数和选项，以满足更复杂的数据重塑需求。例如，我们可以使用margins参数添加边际总计，使用margins_name参数指定边际总计的列名等。

下面是一个使用pivot函数进行高级数据重塑的例子：


# 使用pivot函数进行高级数据重塑  pivot_table2 = df.pivot_table(index='Name', columns='Subject', values='Score', aggfunc='sum', margins=True, margins_name='Total')    pivot_table2

通过添加margins参数，我们在透视表中添加了边际总计，即：每个人的总成绩以及单科目的总成绩，方便我们快速了解每个分类和总体的汇总信息。

四、结语

Pandas中的pivot函数是一个非常强大的数据重塑工具，它能够帮助我们轻松地将数据从长格式转换为宽格式，或者从宽格式转换为长格式。即数据转置。

通过掌握pivot函数的基本和高级用法，我们可以更加灵活地进行数据分析，挖掘数据中的潜在价值。希望本文能够帮助你更好地理解和应用Pandas中的pivot函数，为你的数据分析之旅增添更多动力！

Pandas中的Pivot：数据重塑的艺术

热门文章

最新文章

相关课程

相关电子书

热门

活动广场

任务中心

开发者评测

高校计划

乘风者计划

训练营

阿里云MVP

话题

直播

下载

镜像站

技术资料

插件

Pandas中的Pivot：数据重塑的艺术

热门文章

最新文章

相关课程

相关电子书